论文部分内容阅读
随着信息技术的快速发展,尤其是互联网应用的快速兴起,每天都产生大量的数据,人们面临着越来越严重的信息过载问题。另一方面,技术的发展也促使推荐系统的产生与发展,推荐系统技术在一定程度上能够解决信息过载问题。通过研究个性化推荐系统的现状,发现传统的推荐算法在技术上大部分使用用户显式反馈信息向用户进行推荐,而忽略了丰富的隐式反馈信息,导致推荐系统准确率不高。针对这种情况,给出了一种融合用户行为及行为时间、项目流行度和用户活跃度等多因素隐式反馈信息相结合的综合推荐算法。首先,对常见网站中隐含用户喜好的典型用户行为进行了分类分析,给出了将用户行为数据转换为评分矩阵的预处理方法。在此基础上,针对相对于时间久远的用户行为,最近的用户行为更能表达用户的兴趣和爱好这一特点,将时间衰减因素引入到用户评分矩阵中,形成一个时间加权评分矩阵,以解决传统推荐系统在计算过程中忽略时间因素的问题。时间加权评分矩阵能够加大最近用户行为对用户兴趣偏好的影响,降低时间久远的用户行为对用户兴趣偏好的影响,体现了不同时间的评分值对用户的不同推荐影响。然后,采用矩阵分解方法实现推荐评分预测。针对评分矩阵中的空缺值,根据单类协同过滤问题中负样本选择策略,在现有的利用项目流行度隐式反馈信息定义矩阵分解目标函数的基础上,定义了用户活跃度隐式信息,并利用该信息对矩阵分解的目标函数进行改进。在实现上使用交替最小二乘法对矩阵进行并行化处理,以提高推荐计算效率。最后,在音乐数据集last.fm上对文中提出的融合了用户行为及行为时间、项目流行度和用户活跃度等多因素隐式反馈信息的综合推荐过程进行了实验。通过对比传统评分矩阵分解推荐方法和仅融入项目流行度的矩阵分解推荐方法,实验结果表明改进后的综合推荐方法,能够更近似逼近用户评分矩阵,在评分预测准确性和在Top-N推荐效率上有一定的提高。