论文部分内容阅读
协同过滤推荐作为解决信息过载问题的一项关键技术,它主要是利用已有用户群过去的行为数据来预测当前用户最喜欢或可能感兴趣的物体。其中,作为目前最成功的协同过滤推荐算法,基于邻域的方法广泛应用于电子商务网站、社交网络、视频网站等,成为协同推荐领域的研究热点。但目前的研究存在以下不足:(1)在利用社会化网络中用户之间的信任关系来解决评分数据稀疏性和用户冷启动所导致的推荐准确度和覆盖率降低的问题时,信任关系未得到充分融合利用,导致缺乏一个完善的信任关系推荐模型;(2)在以用户为对象的研究中,选取邻近集合时一方面未考虑目标项目的变化对近邻选择的影响,另一方面也忽略了邻居用户对目标用户的推荐贡献能力;(3)在以项目为对象的研究中,通过项目之间的兴趣关系来解决单一相似度计算不准确的问题时,项目之间兴趣关系的量化过于复杂。因此,本文针对上述问题展开研究,主要的研究工作与成果如下:1.提出了一种基于多重信任的协同过滤推荐算法。该算法首先依据用户间推荐评分的准确性与可依赖度因子提出一种改进的均方差信任度量方法,在此基础上提出基于隐性信任信息的评分模型;其次以最大信任传播距离为约束,提出一种显性信任信息的关系模型;最后依据评分相似性与显性信任关系,利用0-1背包组合优化策略精确地选择出目标用户的近邻集合,从而进行评分预测。在Epinions数据集上与多种主流算法的对比仿真实验结果表明:该算法通过引入有效评分和显性信任关系,可极大缓解数据稀疏性和冷启动问题,并且在不牺牲覆盖率的条件下显著提升推荐准确度。2.提出了一种基于熵优化近邻选择的协同过滤推荐算法。该算法首先利用巴氏系数衡量项目间的相似性,并以此为权重加权计算了用户间的相似性;其次引入信息熵定义用户评分分布特性,通过用户间的评分分布差异性衡量了邻居用户对目标用户的推荐贡献能力;最后结合用户间的相似性和推荐贡献度共同计算推荐权重,并以此为依据构建近邻集合。在MovieLens 1M数据集上的实验结果表明:该算法在以用户为研究对象时,可以在不牺牲时间复杂度的条件下准确地选取近邻集合,显著提升推荐准确度。3.提出了一种融合共同评分用户数和项目兴趣关系的推荐算法。该算法首先利用项目之间的同类性和共同评分用户数改进了Pearson相似性;其次有效地引入项目之间的兴趣关系,通过用户对项目的评分信息定义项目直接兴趣度,接着以系统中的用户为桥梁,一步跳转计算项目间接兴趣度,从而提出一种基于项目兴趣关系的相似性计算模型;最后将项目间的兴趣关系和相似度进行加权拟合,并在此基础上设计了推荐算法。实验结果表明:该算法在以项目为研究对象时,通过有效地引入项目之间的兴趣关系,可显著提升推荐准确度,并且能够极大地缓解数据稀疏性对相似性计算的影响。