基于MAHOUT的几种推荐算法的组合实现与评测

被引量 : 0次 | 上传用户:pettey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的产生使得电子商务得到了前所未有的发展,伴随而来的是商品数目与种类的爆炸式增长。在这种背景下,用户在繁杂的信息中需要花费大量的时间和精力来寻找自己想要的商品,与此同时不同的用户有自己独特的需求。针对此类问题,初期传统的互联网企业有两种解决方案,一是采用分类目录;二是搜索引擎。但是两者有一个共同的局限:需要用户主动提出自己的需求。但是有时候用户无法十分确切描述出自己的需求,为了帮助用户快捷准确的锁定自己感兴趣的物品或信息,个性化推荐系统应运而生。其利用数据挖掘技术,具有高度智能化,能够为用户提供完全个性化的决策支持和信息服务。推荐系统要想使用户获得良好的体验度,作为其核心的推荐算法的重要性不言而喻。目前实际生产中最常用的推荐算法要数协同过滤推荐算法,所谓协同过滤算法就是抓住用户选择商品这一本质,利用用户与商品间的关系,分析用户兴趣,挖掘不同用户之间的相似性或者不同物品之间的相似性,通过各种不同的计算方法形成用户对未知商品的喜好程度的预测。本文所作的主要工作有:1.详细阐述了课题的研究背景,国内外的发展历史及研究现状。2.对推荐系统相关的主要技术进行了详细的阐述,其中重点分析推荐引擎的分类及评测标准。3.利用mahout协同过滤开发模型实现了几种推荐算法的组合,并在Amazon图书数据集上进行了评估、算法的人工验证和手动调优。本文的主要创新点:1.在深入剖析mahout协同过滤算法框架的基础上,对系统实现过程和推荐结果以及对结果的评测进行了跟踪、分析。2.采用限定用户属性的方法优化推荐过程,使推荐结果更加合理,准确。本文通过在Amazon图书数据集上进行的组合算法的实现表明:在数据集比较小的情况下,推荐的结果并不理想;通过限定用户属性的方法,可以使预测结果的均方根误差明显减小,算法更加稳定。本文的工作对推荐系统的实际应用有一定的参考价值。
其他文献
目的:基于Peplau的人际关系理论对社区高血压患者进行综合护理干预,以期提高家庭访视效果,使家庭访视具有科学性和实践性,为社区护士进行家庭访视提供参考依据;提高高血压患者健康
目的:探讨急性食管胃底静脉曲张出血止血时机及影响出血控制成败影响因素分析。方法:选择2011年12月~2014年12月期间我院收治的急性食管胃底静脉曲张出血患者80例为研究对象,
目的 :探讨重度急性有机磷中毒应用血液灌流联合盐酸戊乙奎醚临床价值。方法 :选取2010年1月-2012年12月我院收治的急性重度有机磷中毒患者70例,根据治疗方法分为两组,对照组
2010年10月,国务院经过多方征求意见,颁发了《关于加快培育和发展战略性新兴产业的决定》,从指导思想、基本原则到发展目标一一做了详细的阐述,为我国战略性新兴产业发展方向
目的 :探讨部分趾骨的游离甲瓣移植再造拇指治疗拇指脱套伤后患者拇指功能恢复情况。方法 :选取我院2008年1月~2010年1月收治的52例拇指脱套伤患者,随机分为观察组和对照组,
教学目的:1.知识目标:通过意象鉴赏并感悟诗人的思想感情,熟读成诵。2.能力目标:品析诗歌用典的意旨及作用,提高学生的古诗词鉴赏能力。3.情感目标:培养高尚的品德情操。教学
院系作为高校的基层组织,是推动高教事业前进和发展的基础力量,院系办学质量和办学水平从某种程度上反映了一所高校的整体发展水平。对院系的工作绩效进行科学评估是高校管理工
在基于灵敏度分析的有限元模型修正方法基础上,提出一种对实测模态和结构模型同步修正的结构损伤识别方法。即利用有损结构模态与测量噪声在时频域内的差异,以结构有限元模型
本文将日本流行歌曲歌词的研究成果从不同时期的歌词特征变化、不同类型的歌词特点、其他相关研究等3个方面进行了整理归纳。不同时期的歌词特征变化的研究主要考察了歌词的
随着我国经济的飞速发展及人们生活水平的不断提高,当前凡是涉及到物料、物品搬运的场合自动化水平都在不断的提高,同时自动化搬运技术也在不断地被提出新的、更高的要求。劳