论文部分内容阅读
互联网发展越来越快,与各行各业融合越来越密切,网络用户的信息过载问题日趋严重。推荐系统是一种尝试解决信息过载问题的重要工具,它用于给用户推荐可能感兴趣信息。目前协同过滤是一种比较成熟的推荐算法,但是它存在数据稀疏、冷启动等方面问题。如何才能解决好这些问题已经成为协同过滤算法的研究热点。具体研究内容如下:(1)通过深入研究推荐系统国内外发展现状,发现协同过滤技术是一种比较成熟的推荐算法。协同过滤算法核心在于计算用户相似度。首先根据用户相似度筛选最近毗邻集合;然后采用最近毗邻集合中用户评价数据推测目标项目评分值。但是它存在数据稀疏、冷启动问题。(2)为了缓解协同过滤算法上述问题,改进协同过滤算法。第一,协同过滤算法不能深入发掘用户间关系,所以把用户间信任度添加到协同过滤算法,计算用户间综合信任度。用户间综合信任度分为直接、间接和个人三个方面信任度。第二,不同用户对于不同目标项目的偏爱程度存在偏差,所以将用户偏好度概念引进协同过滤算法中,改进用户相似度,有利于显现用户真实兴趣。第三,预测目标项目评分分为以下两种情况。如果选取邻居用户已经评价过的项目,则将融合用户综合信任度与改进用户相似度引进协同过滤预测评分公式中,有利于缓解协同过滤稀疏问题。如果选取没有邻居用户评价过的新项目,则将用户综合信任度和项目相似度引进协同过滤预测项目评分公式,有利于缓解协同过滤冷启动问题。(3)使用Movielens实验数据集,预设四组对比实验。第一组针对改进的用户偏好相似度进行实验数据稀疏度对比,后三组分别计算它们平均绝对误差(MAE)。比较它们值大小,检验改进算法是否有效与可行。后三组对比实验包括:改进后的算法同传统推荐相似度算法、基于用户协同过滤算法对比;改进后的算法在模拟项目冷启动状况下,同基于用户协同过滤算法对比。结果表明,针对用户评分数据稀疏、冷启动问题,改进后的算法比传统协同过滤算法具备更好推荐性能。新算法基本思想是把用户间信任关系融入协同过滤算法,便于挖掘未知用户关系。利用用户偏好度,改进用户相似度,便于显现真实用户兴趣。筛选最近毗邻集合时,融合用户间综合信任度与改进用户相似度,能提升协同过滤算法精准性和扩展性。将用户间综合信任度、改进用户相似度和项目相似度相结合,便于预测用户对新项目兴趣程度,有效缓解协同过滤数据稀疏、冷启动问题。