论文部分内容阅读
尽管对推荐系统的研究已经超过了十年,却很少有相关研究为匿名用户推荐。数字图书馆环境中的大部分用户都是匿名用户,而且这种匿名访问方式在图书馆界仍会长期存在。如何为这类匿名用户提供个性化推荐,是数字图书馆的一个难点,也是图书馆提高个性化服务质量的一个制约因素。
在数字图书馆匿名访问情况下,如何区分用户身份与兴趣成为“面向匿名用户的个性化推荐系统”需要解决的关键问题。为此,本文提出了“匿名类别标识一相关文档”矩阵模型;通过结合基于内容和基于协同过滤的两种推荐技术,本文给出了一种有效的组合推荐技术,进而设计并实现了一个匿名推荐原型系统。
本文的主要贡献如下:
1.提出了匿名用户模型一“匿名类别标识一相关文档”矩阵模型。匿名推荐包括两个核心问题:匿名用户身份的标识,匿名用户兴趣的判断。通过“项目-兴趣-用户”的映射关系,用匿名用户的类别标识来识别匿名用户,找到了区分匿名用户身份和兴趣的解决办法,并且能够动态跟踪匿名用户的兴趣。
2.首次阐述了重复推荐问题并给出解决策略。由于系统无法确定匿名用户已经访问过哪些项目,推荐算法需要对每一个项目都进行预测,就会带来重复推荐问题-向用户推荐他已经访问过的项目。本文提出了一些启发式规则,能够较好解决重复推荐问题。
3.改善了匿名推荐系统的实时性和可伸缩性。本文提出的算法包括两个步骤,第一步采用离线计算的方式,使得第二步在线计算时只需要进行查表操作,从而能大大提高系统的推荐速度。推荐实时计算需要的项目数量远远小于项目总数,使得系统具有很高的可伸缩性。
4.一定程度上解决了过滤算法的稀疏问题、冷启动问题。在数据稀疏的情况下,即使当前用户没有访问过任何项目,利用本文提出算法第一步基于内容的过滤结果,也可以直接向用户产生合理的推荐。
5.实验表明,本文所实现的原型系统能动态跟踪匿名用户的兴趣,并能提供较高质量的个性化推荐。实验结果验证了提出模型和方案的可行性。