论文部分内容阅读
现在的互联网以及正在逐步建立的物联网,已经使得人们处于信息的海洋之中,对于现在的人们而言,“信息匮乏”的时代一去不复返,协同过滤帮助人们处理信息过载。为更好的发掘出物品的长尾效应,引入协同过滤推荐系统,充分研究用户的个人兴趣,定位于某位特定用户,为用户提供更为个性化的需求,从而将长尾商品准确地推荐给需要它的用户,帮助用户发现那些他们很感兴趣而自己很难发现的物品。协同过滤算法在具体的实际应用场景中,由于用户在最开始,一般只会评价或者购买很少一部分的物品,这就会导致在收集用户的个人偏好的过程中,形成的初始的评分矩阵(用户-物品)非常的稀疏,由此引出协同过滤推荐的数据稀疏问题和“冷启动”问题。在这样的情况下面临的挑战,就是要求协同过滤推荐系统用相对较少的有效的评分来获得准确的预测。对于协同过滤推荐系统中,普遍存在的数据的稀疏问题和“冷启动”问题,为了达到“用相对较少的有效的评分来获得准确的预测”的目标,本文提出了一种新的研究协同过滤推荐的方法——基于局部全局相似度的奇异值分解的协同过滤算法。新的算法主要分为三个部分:(1)评分矩阵(用户-物品)的相似度度量,通过基于局部相似度和基于全局相似度的新的协同过滤架构,来对初始的评分矩阵(用户-物品)进行预处理,获得一个新的评分矩阵,作为下一步算法的输入。(2)评分矩阵(用户-物品)的SVD处理,利用数学上矩阵分解模型奇异值分解理论对评分矩(用户-物品)进行分解,用其预测的结果获得活跃用户的邻居,从而产生较好的预测。(3)采用SVD处理获取最终需要提供给用户的预测值,给出最终的计算推荐。公共数据集试验结果显示,该算法在一定程度上缓解稀疏问题和冷启动问题,并丰富了用户行为的预测结果,提高了推荐精准度。