引入隐式反馈的多维度推荐系统的研究与实现

来源 :湖南工业大学 | 被引量 : 0次 | 上传用户:huanghuang051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的迅速普及,网络应用多样化趋势加快,大数据时代已经到来。数据的急剧增加使得推荐系统中的用户数和项目数也大大增加,相对来说可用的评分所占比例将越来越小,评分矩阵将更加稀疏,这将导致传统推荐算法得出的结果与实际偏差较大,用户体验较差。并且由于大数据量的到来传统推荐算法已不能满足计算的需求,传统推荐算法依赖单节点的计算将面临着新的革命。因此未来满足用户的需求,须采用多节点的计算并结合多维度的数据来改进以往算法,从而应对大数据的冲击。本研究主要从协同过滤推荐算法的数据稀疏性和可扩展性问题两个方面展开研究,首先提出了基于双维度云模型的协同过滤推荐算法。并依据近年来的趋势,引入了隐式反馈数据,提出了引入隐式反馈的多维度推荐算法,最后以该算法为核心设计了推荐系统。本研究工作的具体成果如下所示:(1)提出了基于双维度云模型的协同过滤推荐算法。该算法在双维度数据的基础上引入了云模型和hadoop集群,并且通过动态确定权重,使得用户和项目两个维度的评分权值更合理,得出的预测评分更加的精确。实验数据表明,该算法在MAE值(平均绝对偏差)的表现上相对于其他算法有很大的提升,且通过单机与集群的对比,验证了该算法能适应大数据环境。由于利用了云模型和两个维度数据,数据稀疏性问题也得到了合理的解决,推荐质量得到了一定的提升。(2)提出了引入隐式反馈的多维度推荐算法。该算法充分利用了MapReduce框架在处理大数据时的优势,同时通过对用户-项目评分矩阵的处理得出用户维度和项目维度的预测评分。通过对于用户交互数据的处理,得出期望的隐式反馈兴趣评分数据。通过三个维度评分的综合得出最终预测评分,并根据评分值进行推荐。实验数据表明,该算法在召回率和准确率上的表现相对于其他算法有了较为明显的提升,且数据量越大推荐质量越好,准确度越佳。通过单机与集群的对比验证了该算法适合大数据环境。(3)以引入隐式反馈的多维度协同过滤推荐算法为核心搭建了原型系统。该原型系统使用了用户、项目和隐式反馈三个维度的数据,使用前两个维度的数据有效结合云模型,再结合隐式反馈数据,通过合理的权值来衡量三个维度数据,并有效结合了MapReduce计算框架来处理大数据问题。
其他文献
近年来,以共轭聚合物为基础的太阳能电池的研究逐渐成为热点。但是共轭聚合物太阳能电池低的光电转换效率限制了其实质性发展。最新研究表明,纳米材料与共轭聚合物杂化,是提
目的:胎儿完全型肺静脉异位引流是一组很严重的先心病,是新生儿死亡的主要原因之一。产前诊断胎儿完全型肺静脉异位引流对超声医师具有一定的难度。时间-空间关联成像技术是
我国北纬30°以北的河流在冬季都会结冰,建立在水中的桥梁不可避免的会受到水中结冰的影响甚至威胁桥梁安全,本文以北京北部永定河落坡岭水库上的落坡岭桥为研究对象,对落坡
动补式动词是汉语中一种重要的复合词,从结构上说,主要是“动+动/形”的形式,从语义上讲,动词与补语之间是一种补充说明的关系,补语成分说明动作行为的结果、趋向、状态等,或
现如今,人们对高能耗应用的先进储能技术有越来越迫切的需求,像电动汽车和智能电网存储系统,已经引起研究者们对传统锂离子化学新电池系统的不断探索。因此,可充电锂金属电池
视觉目标跟踪在机器视觉领域中作为一项前沿技术,是实现人工智能的重要组成部分,其主要涉及到图像处理、信号处理、模式识别等专业知识,且目前已广泛应用于安防监控、视觉检
随着互联网的普及与规模的持续增长,数据的刻画形式越来越复杂。传统的算法大多将数据展开成一维向量,再使用基于向量的算法对数据进行处理,这样不仅破坏了数据结构,也为后续
我国经济的快速发展,城市汽车日益增多,带来了一系列严重的交通问题。智能交通系统是改善交通问题的有效途径,车辆检测是智能交通系统中重要的研究课题。然而车辆检测受光照
大量实验结果表明波在含重油孔隙介质中的传播性质随温度改变有较大变化,温度对波传播性质的影响不能忽略。为了研究含重油孔隙介质中波传播性质随温度的变化,本文综合考虑了
在水资源匮乏,社会经济高速发展的大背景下,我国的水资源供需矛盾日益突出。我国北方缺水地区,修建的很多多孔拦河闸以及多孔蓄排兼用水闸,除在汛期过流量大时可能全部开闸放