基于Mahout的兴趣分布混合模型个性化推荐算法研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:bchen2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网科技的飞速发展正改变着整个世界,各行各业随着互联网+的模式快速转变。科技的发展导致信息膨胀愈演愈烈,面对海量的数据人们越来越难以获取自己想要的知识。为解决信息过载问题,许多学者提出利用推荐系统给人们提供个性化的服务,挖掘出人们想要的资源。个性化的推荐服务将会根据用户的偏好行为给出更加符合用户兴趣的推荐列表。对于每一种个性化的推荐算法都会存在优缺点,在这个多元信息化时代,不是一种推荐算法就可以解决所有问题。个性化推荐算法的广泛应用推动着学者们对算法的理论研究,目前算法面临的主要问题有数据稀疏性,冷启动等。而稀疏性问题也是影响推荐算法精度主要因素,针对这一问题,专家学者通过各种方式进行算法改进,提升算法的推荐质量。本文的主要研究目的是提升个性化推荐算法预测评分的准确性和推荐列表的质量。针对目前推荐领域面临数据稀疏性问题,通过对基于用户的协同过滤及隐语义模型进行了深入分析,对比两者优缺点,结合经济学中的基尼系数对用户兴趣分布模式的度量,提出了兴趣分布混合推荐模型。模型首先对用户的行为数据及项目的分类信息进行预处理,然后根据用户兴趣分布的基尼系数来划分用户群体来缩小寻找最近邻的范围,利用隐语义模型的数据稀疏不敏感性,进行预填充用户评分数据项,从而搜索更加准确的邻居用户,提升个性化推荐算法的预测评分,改善算法的推荐质量。最后本文针对所提出的混合模型设计了详细的对比实验,实验平台采用了基于Mahout算法框架,java语言进行编程实现混合模型,与传统的单一推荐算法进行对比分析,分别在推荐的预测评分与推荐列表的质量两个推荐阶段完成了实验对比,实验结果证明了该混合模型的有效性。
其他文献
二十世纪,科技产业园区的出现代表着科技产业化发展的一大进步,128号公路以及硅谷等科技产业园区的成功,给全球的科技产业发展都带来了巨大的影响,科技产业园区的建设与发展
<正>长白县宝泉山镇邱家店村现有村民168人,党员14名。邱家店村党支部充分发挥党建引领作用,把党员创先争优与脱贫攻坚工作相结合,选出村内50岁以下的党员与贫困群众开展结对
社会环境是语言学习中不容忽视的因素。本文从社会环境对外语教学和外语学习的影响入手,阐述社会环境在外语教学与学习中的作用,并结合中国英语学习的现状,分析中国学习英语
目的分析研究中医针灸综合治疗方法对强直性脊柱炎的临床效果。方法在2015年2月—2016年5月收治的强直性脊柱炎患者中选取120例,均给予以电针背部华佗夹脊穴为主疗法以及中医
为了探讨黑茶抗衰老的活性物质及其作用机制,本文收集了近10年黑茶及抗衰老的相关文献进行整理和分析,总结出了黑茶抗衰老的活性物质为茶多酚,其作用机制主要与茶多酚抗氧化
哲学的核心是本体论,即形而上学,它是人们的一种世界观,即人们对整个客观世界终极原因的一种看法或解释。亚里士多德的《形而上学》作为第一本纯粹意义上的哲学著作,其核心内
棉花是最重要的天然纤维作物。棉花种仁含油量达30%38%,并富含油脂和蛋白质,也是优质食用油和蛋白来源。同步提高棉花纤维和种子的单产、改进棉花纤维品质是我国现阶段棉花育
本文通过车辆汽油发动机对点火系统中火花塞的性能要求,阐述了火花塞的结构特性、选配及故障分析等方面,从而正确使用和维护火花塞,使其满足使用要求,有效提高汽油发动机的动
微博作为一种新的社会化媒体已经逐渐渗透到我们每个人的生活,对我们的媒介信息接收和媒介互动产生了重要的影响。除了微博本身以外,媒体机构在微博上开通新的传播路径以及专
<正>按照《孙冶方经济科学基金会章程》规定,孙冶方经济科学奖每两年评选一次。自2018年6月第十八届孙冶方经济科学奖(2018年度)评奖公告发布以后,截至2018年11月底,孙冶方经