论文部分内容阅读
随着互联网技术的进步和大数据时代的来临,互联网在为人们带来信息获取便利的同时,也导致了从海量信息中快速得到有价值信息的困难,即信息过载的问题。个性化推荐是根据用户的历史偏好信息来推荐的,是缓解信息过载问题的有效方式,而协同过滤推荐是推荐技术的应用最广泛的技术之一。协同过滤技术是通过参考相似用户的兴趣来预测目标用户对项目的喜爱程度,选取预测评分较高的项目进行推荐,本文的重点是对个性化推荐中协同过滤算法进行改进研究。针对传统协同过滤算法的准确度和实时性两大问题,提出了相应的改进算法:(1)分步筛选邻居的协同过滤改进算法(Collaborative Filtering with Step Screening Neighbors,SSN-CF),SSN-CF算法通过三步对邻居的筛选,每一步均在上一步的基础上引入新的筛选标准,在第一层传统查找邻居的Pearson相关系数法的基础上增加两步筛选,第二层筛选考虑到用户自身特征属性的影响,如年龄、性别等因素,过滤一些特征差距较大的用户。第三层提出项目优先集概念,通过在项目类别子集中寻找相似度较高的项目邻居,生成项目优先集。并设定评分邻居优先原则,优选出对项目优先集评过分的近邻,挖掘出用户的潜在邻居,提高邻居用户的质量,避免邻居的流失,从而改进准确度。(2)基于用户兴趣更新的协同过滤改进算法(Collaborative Filtering based on User Interest Updating,UIU-CF),UIU-CF算法综合考虑用户的短期兴趣和长期兴趣对预测评分的影响。在短期模块中通过在相似度计算中加入遗忘函数的方法,增强短期兴趣的权重。在长期模块中考虑用户的长期固定兴趣,设立用户间的公共评分项目时间阈值,找出长期公共评分项目,然后通过改进的Pearson相关系数法计算用户相似度,挖掘出长期邻居,从而改进算法的用户兴趣更新的问题。本文对改进算法进行实验,验证所提出的新算法在准确度和实时性方面优于传统算法,由改进算法预测得到的推荐项目更贴近目标用户的偏好,推荐系统的性能能够得到显著提升。