论文部分内容阅读
互联网的迅猛发展,给人们的生活方式带来了强大的冲击,丰富便捷的信息获取方式引发了全球范围内的信息革命。在这样的背景下,大多数商业网站建立起商品推荐系统,为人们提供更加直观有效的服务,但是至今为止,推荐服务却没有在图书馆应用方面得到足够的重视。本文以提高图书管理中图书推荐服务为目的,将数据挖掘技术引入到图书馆管理系统中,文章首先对比了国内外图书推荐系统研究状况,指出图书馆信息推荐服务应该分为几个方面,需要哪些技术支持,并且介绍了常用的推荐技术,对比它们的优势和不足,选择适合进行书目推荐的推荐技术。然后详细的介绍进行书目推荐的数据挖掘方法:聚类分析方法、关联规则分析方法、决策树分析方法,选取每种数据挖掘方法中最适合的算法。在关联规则分析方法中,对其算法Apriori进行改进,引入矩阵的思想,将基于事务数据库的字符串运算转化为基于矩阵的布尔值运算,减少了算法运行过程中对数据库的访问,释放了内存空间,提高算法运行效率。最后以中北大学图书馆数据库中的借阅记录为基础,利用clementine软件对其进行数据挖掘为书目推荐服务提供实例参考。进行数据挖掘时,共分数据预处理、数据挖掘实施、挖掘结果分析及结论建议四步进行,在四个步骤中,数据挖掘实施是重点阶段。本文利用聚类分析、关联规则分析和决策树分析三种方法对借阅记录实施数据挖掘,聚类分析和关联规则分析是从读者角度对数据进行处理,而决策树分析是从图书种类角度对数据进行处理,得到对该图书感兴趣的读者群,然后根据读者是否满足该读者群的特征,判断是否应该向读者推荐这种图书。其中,引入决策树分析方法是图书推荐服务的首次尝试。