论文部分内容阅读
推荐系统(Recommender System,RS)能够挖掘和捕捉用户的偏好,为用户推荐相关的内容,是连接用户和项目之间的桥梁,在人们日常生活中的许多场景里均扮演着相当关键的角色。时至今日,推荐系统更是在线上购物、视频网站以及搜索引擎等诸多领域得到迅猛发展,国内外相应的研究层出不穷,成为近年来学术界与工业界的热点。在社交网络领域,近些年由于用户规模逐渐增加,信息的更新速率越发频繁,网络数据爆炸式的增长引发了信息过载问题。一直以来,学术界及工业界针对如何准确捕捉用户的需求或喜好,并为用户过滤掉无用或不感兴趣的内容,做出了诸多的努力。协同过滤作为个性化推荐领域的一种主流手段,通过寻找不同个体之间的相似性,筛选出最相似的个体来满足不同用户间的个性化需求。尽管协同过滤能够有效缓解信息过载现象并得到广泛应用,但是现有的大多数基于协同过滤的方法在面对数据稀疏以及冷启动场景时实际效果并不让人满意。加之社交网络的特点使得它本身具有复杂性,传统推荐方法于社交网络环境下为用户进行个性化推荐时结果并不理想。本文在深入分析常见的推荐算法的基础上,尝试在个性化协同过滤算法上结合多样信息融合的思想,帮助更好地理解用户的兴趣;又对协同过滤算法中常用的用户—物品评分数据,结合矩阵分解的思想并利用社交网络信任度模型来改善数据稀疏问题,提高推荐系统的预测准确度。本文主要研究工作如下:首先,本文对社交网络推荐系统的基本思想、分类比较进行了简明扼要的介绍,并对常见的推荐评价指标作详细阐述。针对基于协同过滤的推荐算法以及基于模型的推荐算法进行了深入研究。分析比较不同推荐方法的基本思想和原理,并且指出其缺点或不足。其次,针对传统基于用户的协同过滤算法单一化利用物品评分信息导致精确度不佳的情况,提出了利用多样信息融合的个性化推荐算法。综合社交网络环境中能够反映用户需求或偏好的多种信息,提升推荐结果的预测准确度,并有助于缓解推荐系统常见的冷启动问题。改进算法利用真实数据集Movielens以及Last.fm来实现全方面评估,对于Top N推荐结果做出预测准确度度量,并和一些常见协同过滤算法对比实际性能差异。同时测试了应对冷启动问题时的表现。最后,考虑到传统协同过滤算法在含有社交网络信息的环境中性能低下的问题,利用矩阵分解的思想并整合社交网络信任度信息,提出基于社交信任度的SVD(Singular Value Decomposition)推荐算法。新算法首先构造用户的信任度矩阵,添加信任者以及受信任者偏置,改进信任模型,降低数据维度。再结合常见的评分数据提升算法结果的准确性。实验基于真实数据集Film Trust上进行,对提出的新算法进行评估,对于评分预测的结果进行预测准确度度量,将离线测试结果进行对比分析,验证新算法的有效性。