论文部分内容阅读
随着互联网的普及以及现代电子商务的快速发展,网络上的信息呈指数增长的趋势,从而出现了所谓的“信息爆炸”和“信息过载”现象。个性化推荐技术是解决信息过载问题的有效手段。作为当前应用最广泛的个性化推荐技术之一,协同过滤推荐技术的核心思想是协同合作。近些年来,虽然协同过滤推荐技术在实际应用中取得了巨大的成功,但同样面临着严峻的问题。其中,最难解决的问题就是数据稀疏问题。数据稀疏问题是推荐系统中用户和项目数据不断增加的必然结果,因为用户给予评分的项目数量很有限,导致了用户评分矩阵稀疏,而协同过滤推荐算法是根据用户的历史评分数据实现对用户的推荐。因此,数据稀疏问题成为制约协同过滤推荐算法推荐结果准确性的一个重要因素。本文主要研究面向数据稀疏的协同过滤推荐算法。首先,从两个角度出发分析传统协同过滤推荐算法在数据稀疏情况下的弊端。然后,在此基础上,本文提出了两种改进算法:融合争议度特征的协同过滤推荐算法和基于项目递归关系的协同过滤推荐算法。最后,本文将提出的算法应用到实际的平台中以检验其实用性。具体研究内容如下:1)分析了传统的计算项目相似度方法在数据稀疏情况下计算项目相似度不准确问题。本文从项目间的整体评分角度出发,提出了争议相似度的概念,并将争议度特征融合到基于项目之间共同用户评分的传统相似度算法中,进而提出了融合项目争议度特征的协同过滤推荐算法,缓解了传统算法在稀疏数据情况下相似度计算不准确的问题。实验结果表明该算法在数据稀疏环境下可以明显提升推荐质量。2)分析了现有协同过滤推荐算法在预测目标用户对于目标项目评分时导致了数据的进一步稀疏化的原因。在此基础上,将项目间的递归关系融入协同过滤推荐算法,利用递归的思想提出一种基于项目递归关系的协同过滤推荐算法,基于项目递归关系的协同过滤推荐算法能够充分利用了稀疏数据情况下用户评分信息,避免了预测目标用户对于项目评分时数据的进一步稀疏化,实验结果表明该算法可以有效地缓解协同过滤推荐中的数据稀疏问题。3)将本文提出的两种算法应用在《图书馆交互式科研管理平台》中以检验算法的实用性。