论文部分内容阅读
图书馆是高校重点建设场所,每年都会引进大量的图书。如何在浩瀚的书海中帮助读者找到他们感兴趣的图书是一个亟待解决的问题。人工推荐和传统的图书搜索功能过于依赖过往的经验,并且这些经验无法被存储从而使更多的人受益。因此,在高校图书馆中建立个性化推荐系统有着重要的意义。相对于数字图书馆,目前国内高校图书馆个性化推荐系统还不成熟,主要原因有以下几点。首先是图书信息不充分,缺少内容、摘要等文本信息,无法通过主题模型或文本分析使用基于内容的推荐;其次,高校图书馆没有评分系统,无法获得读者的喜好程度,难以使用协同过滤的推荐;最后,鉴于学生的身份,高校读者急需一种能够提供与其专业相关并且具有知识结构上联系的图书推荐方式,但目前的推荐算法还没有相应的实现方案。为了解决上述问题,本文主要作出了以下贡献:(1)提出了一种基于兴趣度模型和类型因子的协同过滤推荐算法,该算法利用读者借阅行为数据建立兴趣度模型来近似读者评分,以此解决高校图书馆缺少评分系统的问题,并在此基础上使用中图类型因子解决借阅关系稀疏的问题。(2)深入分析高校学生读者的推荐需求,提出了孤点推荐的问题。该问题描述的是学生在不同学期借阅的图书之间应该有着知识结构上的联系和承接,而不是像一个个孤点一样。(3)针对孤点推荐问题,提出了一种基于马尔可夫过程的专业图书树推荐算法,该算法通过统计不同学期图书类型之间的关联度来得到转移概率矩阵,并通过首学期的初始类型向量乘以转移概率矩阵来得到各个学期推荐的图书。(4)利用本文提出的两种推荐算法,结合Hadoop分布式系统中的MapReduce计算框架,设计与实现了在现有借阅系统的历史数据之上的高校图书推荐系统。通过实验证明和实例分析,本文提出的两种高校图书推荐算法有一定的推荐效果,并且具有实际应用的价值,为高校图书推荐的研究提供了新的思路。