基于邻域的协同过滤推荐算法研究

来源 :解放军信息工程大学 | 被引量 : 3次 | 上传用户:soton0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤推荐作为解决信息过载问题的一项关键技术,它主要是利用已有用户群过去的行为数据来预测当前用户最喜欢或可能感兴趣的物体。其中,作为目前最成功的协同过滤推荐算法,基于邻域的方法广泛应用于电子商务网站、社交网络、视频网站等,成为协同推荐领域的研究热点。但目前的研究存在以下不足:(1)在利用社会化网络中用户之间的信任关系来解决评分数据稀疏性和用户冷启动所导致的推荐准确度和覆盖率降低的问题时,信任关系未得到充分融合利用,导致缺乏一个完善的信任关系推荐模型;(2)在以用户为对象的研究中,选取邻近集合时一方面未考虑目标项目的变化对近邻选择的影响,另一方面也忽略了邻居用户对目标用户的推荐贡献能力;(3)在以项目为对象的研究中,通过项目之间的兴趣关系来解决单一相似度计算不准确的问题时,项目之间兴趣关系的量化过于复杂。因此,本文针对上述问题展开研究,主要的研究工作与成果如下:1.提出了一种基于多重信任的协同过滤推荐算法。该算法首先依据用户间推荐评分的准确性与可依赖度因子提出一种改进的均方差信任度量方法,在此基础上提出基于隐性信任信息的评分模型;其次以最大信任传播距离为约束,提出一种显性信任信息的关系模型;最后依据评分相似性与显性信任关系,利用0-1背包组合优化策略精确地选择出目标用户的近邻集合,从而进行评分预测。在Epinions数据集上与多种主流算法的对比仿真实验结果表明:该算法通过引入有效评分和显性信任关系,可极大缓解数据稀疏性和冷启动问题,并且在不牺牲覆盖率的条件下显著提升推荐准确度。2.提出了一种基于熵优化近邻选择的协同过滤推荐算法。该算法首先利用巴氏系数衡量项目间的相似性,并以此为权重加权计算了用户间的相似性;其次引入信息熵定义用户评分分布特性,通过用户间的评分分布差异性衡量了邻居用户对目标用户的推荐贡献能力;最后结合用户间的相似性和推荐贡献度共同计算推荐权重,并以此为依据构建近邻集合。在MovieLens 1M数据集上的实验结果表明:该算法在以用户为研究对象时,可以在不牺牲时间复杂度的条件下准确地选取近邻集合,显著提升推荐准确度。3.提出了一种融合共同评分用户数和项目兴趣关系的推荐算法。该算法首先利用项目之间的同类性和共同评分用户数改进了Pearson相似性;其次有效地引入项目之间的兴趣关系,通过用户对项目的评分信息定义项目直接兴趣度,接着以系统中的用户为桥梁,一步跳转计算项目间接兴趣度,从而提出一种基于项目兴趣关系的相似性计算模型;最后将项目间的兴趣关系和相似度进行加权拟合,并在此基础上设计了推荐算法。实验结果表明:该算法在以项目为研究对象时,通过有效地引入项目之间的兴趣关系,可显著提升推荐准确度,并且能够极大地缓解数据稀疏性对相似性计算的影响。
其他文献
白居易所作《长恨歌》以"安史之乱"为界分为两大部分,前一部分对李、杨荒淫无度、招致祸乱作了明显讽刺,后一部分对两人的爱情悲剧赋予了深切同情,而且更偏重于后者.……
食管癌是一种常见的恶性肿瘤,根据世界卫生组织公布的数据,全世界每年有超过40万人死于食管癌,致死人数列所有肿瘤第六位。中国是食管癌高发地区。临床上治疗食管癌的方法以
设计了双系列厌氧/缺氧交替运行式A2O(D-A2O)中试反应器,进行18个月的生活污水处理的试验研究。研究结果表明,反应器最佳水力停留时间(HRT)为6 h。当气温≥28℃时,温度的影响主要
激发技术的综合使用已成为磨细矿渣粉利用的研究热点,但是多种激发方法并用时,可能发生相互抑制或促进作用。激发磨细矿渣粉活性的方法有物理激发、化学激发、高温激发和复合
奶牛养殖小区作为奶牛养殖的一种组织形式,变农户零星散养为集中连片规范饲养,在实行标准化生产、环境污染控制、动物防疫管理、社会化服务体系等方面都具有一定的优势,发展很快
本文对罗氏沼虾的繁殖习性进行了较为详细地描述。性成熟的雌虾必须经过生殖蜕皮方可交配、产卵;受精卵粘附于腹肢刚毛上;在水温24℃左右的条件下,幼体孵出约需27天;性成熟雌虾能多次
这是一个充满戏剧性,甚至沾染上鲜血的现实商战故事,充满了谎言、利益以及对人性的拷问在近三个小时采访时间里,他不停调整着坐姿,仿佛在寻找最舒服的状态。谈及与吴长江不愿
【目的】研究探讨胆管细胞癌癌组织和癌旁组织中FAP-1蛋白的表达水平差异及其与Bcl-2/Bax基因调控细胞凋亡的关系,为治疗胆管细胞癌提供临床参考价值,为将来研究胆管癌的防治
目的探查就阴道分娩孕妇在产后出血中实施预防护理干预举措的效果应用。方法选取本院收治的阴道分娩孕妇200例,并按照随机数字表法分成两组,为对照组和观察组,均为100例。其