基于随机游走和聚类平滑的两阶段协同过滤算法

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:jundy123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展,网上的信息以指数级的速度增长。用户很难在短时间内找到自己感兴趣的产品或信息。为了解决“信息过载问题”,个性化推荐系统应运而生,它是根据用户的兴趣特征或购买行为,向用户推荐其感兴趣的信息或商品,是一种个性化服务系统。协同过滤是个性化推荐技术中广泛采用的推荐技术,它是根据用户已有的评价信息或购买记录分析用户的喜好,再根据用户兴趣为其推荐项目。随着用户和项目数量的不断增加,而用户对项目的评分信息非常有限,使得用户-项目评分矩阵极端稀疏,推荐系统的性能和推荐质量受到严重的影响。本文针对数据稀疏问题提出一种基于随机游走和聚类平滑的两阶段协同过滤算法。离线阶段:计算项目间相关性,通常的方法是直接计算项目间的统计相关性,如余弦相似性,但这些方法在稀疏数据下效果不好。本文提出了一个新颖方法通过加权累加各步转移概率对项目间相关性进行描述。聚类平滑,根据得到的项目相关性矩阵对项目聚类,利用聚类信息对未评分数据进行平滑处理。在线阶段:根据离线阶段得到的项目间相关性查找目标项目的邻居并预测目标用户的评分。本文提出的方法能加强项目间相关性的描述,特别是在训练集比较稀疏的情况下,使用传统相似性计算方法无法有效地描述项目间的实际关系,而该方法能很好的工作。实验表明,根据用该方法得到的项目相关性矩阵查找邻居将更加准确,可以有效地缓解稀疏数据的影响改善推荐的性能。
其他文献
网络钓鱼攻击已经成为当前网上交易安全的一个重大威胁,其对电子商务的发展造成了很大阻碍,因而对钓鱼防范的研究成为网络安全领域的热点问题。在众多钓鱼防范技术中,利用URL
本体作为表达知识的共享概念模型,被广泛应用在诸多领域。即使在同一领域内,领域本体间也不可避免地出现相同概念有着不同的定义、概念重叠等问题,造成本体异构,给领域本体间的交
随着空间信息技术、大气物理学等学科的迅速发展,人类对宇宙的探索不断深入,宇宙中的各种潜在的对人类危害也逐渐显露。太阳风就是其中一种人类了解甚少而危害巨大的宇宙现象
随着人体运动数据采集技术的进步,用数据表示的人体运动的研究越来越受到人们的关注。人体运动的研究在医疗康复、模拟场景、以及影视等领域有着很大的应用空间。本文的研究
以Internet为代表的计算机通信网络正在成为全球信息系统越来越重要的基础设施。安全电子邮件、电子政务、电子商务以及电子银行的广泛应用和发展对互联网提出了更高的安全性
遗传算法最初是由美国的Holland提出的,后经Goldberg总结得出其基本框架结构。它可以解决现实生活中的许多问题,如生产调度问题、组合优化、函数优化、图像处理、机器人学、
安全群组通信是一个十分热门的研究领域,其中组播密钥管理机制的研究是最重要也最具有挑战性的工作。本文重点研究面向安全群组通信的组播密钥管理方案,在充分研究各类组播密
矿业生产中压风机是不可缺少的设备,现场压风机房环境恶劣为压风机司机工作带来困难。本文主要研究了压风机的监控保护和压风机组的调度,通过计算机房远程集中监控,对于压风机运
互联网的出现改变了我们的生活、工作、学习乃至娱乐的方式。网上丰富的基础教育资源为广大基础教育工作者、学生以及学生家长提供了充足的参考资料和教育信息,然而由于缺乏行
鉴于三维人脸模型在影视动漫、广告宣传、安全认证以及医学科学等众多领域的广泛应用,如何有效获取三维人脸模型显得尤为重要。通过先进的仪器设备直接获取人脸三维数据以及