论文部分内容阅读
随着互联网云计算的崛起,用户已不再为缺少数据资源而发愁,取而代之的是如何从众多数据资源中找到符合自己兴趣的,用户面对巨大的数据量常常显得束手无策。因此,推荐系统应运而生,既可为用户个性化定制又节约了用户时间的推荐系统成为一种迫切需要。个性化推荐系统不仅帮助了在海量数据中感到困惑的用户,把用户从不能满足自己真正需求的困境中拉出来,还提高了对信息的利用率。推荐系统已经在很多领域成功应用,比如电子商务、视频网站、各大门户网站等。由此可见,对推荐算法进行改进与创新具有十分重大的社会价值和现实意义。基于模型的协同过滤算法是现如今用途最广泛的推荐算法之一,此外,概率矩阵分解模型具有良好的推荐效果。它通过学习用户或项目的潜在特征,把高维矩阵分解成低维的近似矩阵来进行推荐,能够有效处理海量数据。现有的协同过滤推荐算法都存在一些缺陷,如数据太过稀疏以及忽略了用户兴趣随时间的变化等问题。针对以上推荐算法存在的不足,本文提出了一种基于融合时间因子和项目聚类的概率矩阵分解推荐算法,利用时间衰减函数挖掘用户间潜在的特征关系并寻找与目标用户最相似的用户集合,利用项目聚类的方法找到项目间潜在的特征关系并找出与目标项目最相似的项目集合,然后将其与概率矩阵分解算法相结合。针对数据的稀疏性本文提出了一种基于用户近邻的加权Slope One算法的填充模型。在利用融合用户最近邻的加权Slope One算法模型为评分矩阵进行填充,在考虑了项目间偏差的同时增加了对当前目标用户最近邻的筛选,以保证只有和当前目标用户偏好相似的用户,其评分才参与推荐。其优点是使用数量较少然而质量高的数据帮助目标用户预测其对商品的喜好,使得推荐结果更精准。通过在真实电影数据集上与其他算法进行对比分析,可以看出本文所提出的算法有更好的推荐效果,给出的推荐列表更符合用户的个人偏好和需求。本文提出的算法在视频直播和电影推荐领域和以前传统的推荐算法相比可以有效地解决数据稀疏性和冷启动问题,并很好的考虑了随着时间流逝用户兴趣偏好的改变带来推荐结果不准的情况。在今后的工作中,将进一步研究并解决时间因素在项目关系中的影响,以及节假日、季节的变换会对用户的偏好产生的影响,相信在不断的学习和深入研究之后,将会得到更好的推进结果。