论文部分内容阅读
随着互联网业务的迅速发展,网络结构更加复杂,巨大的信息量在给用户带来方便快捷的体验同时也使信息的利用率降低,用户常常会因此而迷失其中,致使出现了信息膨胀也称作信息过载的问题。推荐系统的出现有效地缓解了这一矛盾。但是,数据的稀疏性、冷启动以及忽略用户兴趣迁移等问题的存在却阻碍着推荐系统进一步的发展。本课题的目的就是解决这些问题。本文提出了一种基于柯西分布量子粒子群的混合推荐算法。该算法首先构建了基于时间因子的混合推荐模型,然后,在该模型的基础之上,利用柯西分布量子粒子群算法搜索模型中的最优参数组合。基于时间因子的混合推荐模型是通过把用户和项目的特征属性信息添加到传统的协同过滤推荐算法中构建而成的。这样做有两点优势:(1)在计算用户或项目的相似度时,如果用户评分矩阵过于稀疏,影响相似度的计算,那么就可以利用内容信息进行计算,可以有效克服数据稀疏性的影响;(2)在新用户或者新项目加入进来的时候,可以利用用户和项目的内容信息进行相似度的计算以及推荐等工作,能够有效抑制冷启动的影响。除此之外,在模型建立过程中还做了两方面的改进,一方面是改进了相似度的计算方法,另一方面是引入了能够代表用户兴趣迁移特性的时间因子。进一步地,用户的特征属性信息通常包括性别、年龄、职业、居住地等很多方面,以往的推荐算法中并没有考虑这些特征对实际应用的推荐问题是否真的有影响。实际上,考虑所有的特征所得到的推荐结果不一定是最准确的,还可能增加不必要的计算量。于是,本文对基于时间因子的混合推荐模型进行优化,利用改进的离散粒子群算法搜索最优的用户属性特征组合。最后,优化后的混合推荐模型共涉及5个参数,分别为:用户评分和内容权值、项目评分和内容权值、基于用户推荐和基于项目推荐权值、用户最近邻居阈值和项目最近邻居阈值。如果人为进行选择,工作量极大。因此,本文采用柯西分布量子粒子群算法来搜索模型中的最优参数组合,以提高推荐效果。本文提出的算法与传统的协同过滤推荐算法以及利用粒子群和人工蜂群进行参数搜索的算法进行比较分析。实验结果表明:在提高推荐准确度、缓解数据稀疏性以及冷启动问题等方面,本文提出的算法都优于其他的算法。