论文部分内容阅读
随着电子商务和网络资源的快速发展,上网人数也在迅速的增加,用户如何快速找到自己所需资源是一个亟待解决的问题,个性化推荐便应运而生,它使用户由以前的自己寻找所需的商品转变成系统主动向用户推出其可能感兴趣的商品,较好地解决了信息过载问题,从而留住老客户,吸引潜在客户,为商家创造利润。个性化推荐可以针对不同的用户向其推荐不同的商品,符合人们个性化的要求。协同过滤作为个性化推荐中应用最成功、最广泛的推荐技术,已被广泛地应用到各种商业网站、电子图书馆等领域。但是,协同过滤也面临着一些瓶颈问题,如可扩展性问题、稀疏性问题、冷启动问题、安全性问题等。协同过滤分为基于内存的协同过滤和基于模型的协同过滤。本文在基于模型的协同过滤推荐的理论基础上,采用贝叶斯技术和用户聚类技术离线建立模型,在线进行推荐,较好地解决了可扩展性问题和冷启动问题。针对数据稀疏情况下传统用户相似性计算的不足,本文分析用户的局部偏好相似性,提出了基于用户局部偏好相似的协同过滤算法,较好地解决了数据的稀疏性问题。基于此,本文的主要工作如下:(1)针对可扩展问题,本文提出了一种基于贝叶斯模型填充的用户聚类协同过滤推荐算法。对两个用户评分项目并集中的未评分项预测评分的过程中,充分利用了用户和项目的属性信息,进行贝叶斯填充。在用户聚类过程中对初始聚类中心的选取做了改进,并在预测评分公式中引入了用户权重这一因子。贝叶斯模型填充和用户聚类过程均离线进行,在线完成推荐。实验结果表明该算法提高了推荐质量,较好地解决了可扩展性问题和冷启动问题,比较适合于可扩展性要求较高的应用领域。(2)针对数据稀疏情况下传统用户相似性计算的不足,本文提出了一种基于用户局部偏好相似的协同过滤推荐算法。该算法采用局部偏好相似来计算用户之间的相似性,在最近邻用户对目标用户的待预测项目评分较少的情况下,综合用户兴趣度和slope-one算法进行预测评分,较好地解决了稀疏性问题,并用实验验证了算法的可行性。该算法比较适合于系统初始建立时,数据量不大、推荐精度要求高的应用领域。