论文部分内容阅读
随着互联网的快速发展,大数据逐渐渗透到了各行各业,如何从海量的数据中检索出有用的信息,一直以来都是人们研究的重要课题。最初的信息检索技术,要求人们输入关键字,然后返回相关的信息,不过并不能满足人们对于结果的个性化需求。在此背景之下,推荐系统应运而生,它能够利用用户的潜在喜好,推荐相关的信息。推荐系统自开始到现在,已经产生了大量相关应用和研究工作。经典的推荐算法有基于内容的推荐、基于关联规则的推荐、基于协同过滤的推荐等,可是随着进一步的发展,这些算法越来越不能满足个性化的推荐的需求,因为大部分算法并没有考虑推荐的上下文信息。现有的推荐算法往往根据用户过去的喜好,并计算用户或者物品的相似性进行推荐,往往存在数据稀疏和冷启动的问题,而且推荐结果的多样性无法得到保证。为此,本文研究了最新的热传导算法,结合用户的兴趣对其做了改进,然后对用户的兴趣进行了建模,并提出一种兴趣扩展的方法,最后为了达到更高推荐性能的要求,提出了混合推荐的策略。首先,论文分析了推荐系统中二部图的相关性质,对影响用户决策的行为因素进行了研究,在考虑用户的“活跃性”和用户兴趣的基础之上,对传统的基于二部图的热传导算法进行了改进,在两大公测数据集上的实验表明,改进后的算法能够得到比原先算法更高的准确率和更加丰富的结果。其次,结合传统的基于概率主题模型的推荐算法,对用户的兴趣进行建模,可是兴趣存在易变性,用现有的算法来得到的用户的兴趣,只能得到用户当前的兴趣分布,或者得到相似的人的兴趣,不能预测和挖掘用户新的兴趣,所以推荐的结果也仅仅局限在用户已知或者相似的结果,这就是推荐系统中的“过拟合”现象,针对这一问题,本文提出了一种基于随机游走的兴趣扩展算法,实验表明兴趣扩展后的算法,更能把握用户当前的兴趣。最后,推荐领域中几种混合的算法往往能够克服相互的不足,因此提出了基于位置和基于得分的两种线性混合的算法和一种基于人工神经网络混合的算法,对用户的评分进行预测。