论文部分内容阅读
随着计算机技术和网络技术的快速发展,互联网应用与服务呈爆发式增长,数以亿计的资源信息被产生,“信息过载”成为影响人们工作与生活的重要问题。推荐系统作为解决信息过载的主要途径之一,已经被广泛应用于社交网络、内容服务以及电子商务等多个领域。虽然推荐系统的研究与应用取得了较大进展,但随着时间的推移,外部情境与内部需求都发生巨大的转变。为了顺应了技术发展的潮流,本文从两个方面进行研究:一是在协同过滤算法中研究了推荐系统的稀疏性、冷启动和概念漂移问题;二是在群组推荐情境中研究了推荐序列公平性和排序问题。论文工作主要包括:(1)提出了基于邻域模型和动态时间的协同过滤算法。首先采用了一种更加准确的基准值偏好模型,提高了相似度的准确性,其次对评分预测算法存在误差的问题,提出结合行为数据和联合派生插值权重的计算方法;然后为了应对推荐过程中用户的喜好随时间动态变化的特性,引入了时间衰减函数来改善动态变化问题对推荐精度的限制;最后在数据极端稀疏的情况下重新定义了冷启动问题,采用了阈值条件判断对评分结果进行修正。(2)提出了基于群组推荐系统的矩阵分解推荐算法。首先从群组发现角度改善公平性问题,利用奇异值分解(SVD)算法对数据中的隐语义因子进行识别,再根据计算得来的隐语义因子对用户群组进行划分;其次针对群组内推荐序列排序问题,采用了游走二部图的算法对推荐序列进行排序。(3)采用MovieLens数据集对上述算法分别进行了实验,验证了本文算法的有效性。本文提出的协同过滤推荐算法在RMSE和MAE分别比传统算法低1.8%和1.9%;数据稀疏度分别为96.217%、97.478%和98.739%情况下,本文算法相对其他两种变化度不大,RMSE和MAE维持在0.93和0.73附近。通过对比群组推荐算法的效果,本文算法能够最大限度的改善群组推荐结果,在群组大小为64的情况下,对随机群组推荐精度的改善比达到了3.91%。实验结果表明:(1)改进后的协同过滤推荐算法更加准确,同时可以一定程度的解决稀疏性、冷启动和概念漂移问题。(2)通过SVD算法识别隐语义因子,对隐语义因子进行聚类划分的群组发现方法,可以提高群组用户对推荐序列的满意度,游走二部图的方法可以改善推荐序列,提升群组用户的共识度。