论文部分内容阅读
图书采访是图书馆藏书建设和文献资源布局的首要内容,如何科学的进行图书采访,组建馆藏以服务高校的学科建设和满足读者的需求是一个亟需解决的重要问题。目前的图书馆自动化系统极少涉及如何做出采访决策,一般只是为决策人员预留一个接口用来传递决策信息,决策人员大多是采用经验法和专家法来决策,容易受到主观因素影响且缺乏全面性。本文通过研究图书采访的理论基础,分析影响图书采访决策的因素,借助数据挖掘中的分类、聚类和关联技术方法,对影响图书采访决策的因素和数据进行挖掘,为图书采访工作提供决策支持,并设计实现了这一基于数据挖掘的图书采访决策系统。主要工作包括:(1)研究高校图书馆的特点和性质,及图书采访理论,分析图书采访的流程,确定图书采访决策的影响因素。结合典型的数据挖掘算法,如:决策树,K均值和Apriori算法等,设计了图书采访决策系统,系统能提供直接决策结果,是否进行采购而且还提供采购建议复本数。(2)设计实现了基于数据挖掘的图书采访决策的原型系统。系统采用SQL Server2005作为数据库,采用Weka程序包作为数据挖掘算法库,以C/S方式实现。系统能根据学科建设和馆藏情况,将采访资金在各个学科中进行合理分配。系统不仅能通过决策树方法为新图书进行采访决策,而且还提供新图书的可能和潜在读者群。这样采访人员可以把相关新图书目录发送给特定读者群,让这些读者对新图书进行需求评估。根据读者群的反馈,采访人员可以对决策结果进行修正。这样系统不仅仅只单一提供科学工具分析后的决策,而且还能获得读者的直接评估,并将两者有机地结合在一起。(3)基于**大学图书馆的实际数据对基于数据挖掘的高校图书采访决策系统的性能进行了评估。在文中,将**大学最近几个月的采购的新书作为待采购新书,输入到系统中进行决策,决策结果为**大学的图书采访提供了有益参考。