协同过滤推荐算法稀疏性与可扩展性问题研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:tyybj2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会从IT时代迈向DT时代,人们每天面对的信息呈爆炸般增长,信息过载已经成为困扰行业发展的一大阻碍。特别是在电子商务领域,面对琳琅满目的商品,用户却不得不花费更多的时间来寻找自己中意的商品。推荐系统的发展有效弥补了这种缺陷,其中协同过滤推荐算法的研究更是取得了巨大成功。但是随着商品越来越多,用户-项目评分矩阵越变越稀疏,传统的协同过滤推荐算法推荐精度受到比较大的影响。另外,受单机性能的制约,面对海量数据传统协同过滤推荐算法的计算效率以及可扩展性也面临着严峻挑战。本文详细研究了协同过滤推荐算法的数据稀疏性问题以及随着数据量增长可扩展性较差的问题,并针对这两个问题从改进相似度计算方法改善数据稀疏性和采用分布式编程算法提高算法可扩展性两个角度改善推荐质量。第一,用户评价数过少导致用户-项目评分矩阵极度稀疏,降低了协同过滤推荐算法的推荐精度。本章从项目的评分向量整体分布情况出发,提出了辅助因子相似度的概念,并将辅助因子相似度与基于项目的传统的相似度方法进行融合,提出了融合辅助因子的协同过滤推荐算法。在项目共同评分数据很少的情况下,改善了推荐精度不足的问题。实验证明,本章算法可以有效的缓解数据稀疏性,提高推荐精度。第二,针对传统单机的协同过滤推荐算法随着数据集增长可扩展性较差的问题,本章实现了基于Hadoop分布式平台的协同过滤推荐算法。计算用户偏好向量和共现矩阵的乘积来得到推荐向量,通过动态增添集群节点改善算法的可扩展性。计算矩阵乘时放弃传统的矩阵乘法,采用一种改进的矩阵乘法部分点积法,减少了用户偏好向量稀疏性带来的大量无效计算,提高了计算效率。最后,实验证明,本算法有效的提高了计算效率,随着数据集增大可扩展性良好。
其他文献
随着计算机和多媒体技术以及Internet的飞速发展,图像信息也急剧增长,如何从海量的图像数据中高效快速地检索出用户所需图像成为计算机领域的一个重要课题。然而,从图像的视
目前广泛采用的数字化微注射系统在进行微流量注射时,多采用手动操作或基于压电陶瓷的一次逆压电效应原理进行定位、注射,存在着控制精度低及系统结构比较复杂等缺点。因此研
随着老龄化社会的到来,低成本智能服务机器人将成为机器人领域中重要的研究和应用方向。而服务机器人智能水平与其定位导航能力密切相关,因此实现并改善服务机器人定位导航的性
合成孔径雷达(SAR)是一种新型的高分辨率成像雷达,它具有全天候、全天时工作以及穿透一定覆盖物的能力,可以在恶劣的气候条件下获得类似光学影像的高分辨率雷达图像,在军事和国
流行病的监测与预警是人们时刻关注的重大问题。传统的流行病疫情监测预警系统通常采用数据报表的方式来表现疫情数据和对疫情进行统计分析的结果,不能实现从地理角度出发,所以
汽车工业快速发展的今天,汽车生产线仪表板系统也得到迅速的发展。汽车仪表板在生产的过程中产生了很多问题,其中的一个重要问题就是汽车仪表板的检验问题。汽车仪表板将汽车
电熔镁砂是一种纯度高,耐高温,结构致密的高级耐火材料,被广泛地应用于冶金航天工业,核工业,光学和电子工业,超导材料,高温窥视镜等诸多领域。目前,电熔镁砂生产行业中应用最
流程工业是我国国民经济的重要组成部分,其生产过程的高温、高压、高危险性使针对过程的监控与故障诊断成为重中之重。本课题以过程的监控与故障诊断问题为主要研究内容,利用
随着现代化网络教育技术的发展,如何在网络环境下研究并建立一个全面的、有效的、安全的、专业实验室教学管理平台,已经成为近几年教学工作者所关心的热点问题之一。实验室教
多尺度分析发展日益成熟,并在图像处理领域有着广泛的应用。图像融合可以结合不同源图像之间的信息,从而获得信息更加丰富、清晰的融合图像。二代Curvelet变换作为一种多尺度