大数据下的个性化推荐研究与实现

被引量 : 0次 | 上传用户:honest1988li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的迅速发展使得大量的信息爆炸式的呈现在大众面前。信息爆炸会降低信息的使用率,也就是所谓的“信息超载”。个性化推荐,包括个性化搜索是当前研究的热门领域,它可以很好的提升用户体验,从而提升企业营销。通过相关的机器学习及数据挖掘技术,推荐系统挖掘用户的购买倾向,将用户可能感兴趣的商品推荐给用户。个性化推荐系统通过对用户信息或者商品信息建模,利用相关的数据挖掘算法计算出用户可能感兴趣的商品,并融入其他算法进行筛选、优化,来进行个性化推荐。一个良好的推荐系统可以挖掘出用户潜在的消费偏好,为不同的用户提供针对性的服务。在本论文中,针对海量大数据这一需求背景,提出了基于协同过滤以及基于内容的组合推荐算法搭建的个性化推荐引擎模型,并尝试性的融入了基于文本相似度的热点推荐。该模型是针对大数据推荐所面临的问题而提出的,它包括离线数据计算与在线推荐两个主要模块。离线数据计算模块被用于离线计算用户初始的偏好商品列表,在线推荐模块被用于实时分析用户的行为,进而优化筛选离线计算的推荐结果,最终将最优的结果推荐给用户。两者结合可以提供完整,动态的推荐服务。接着深入分析了传统协同过滤算法的弊端,提出了一种组合推荐的方案进行改进,最后通过国内某电商的真实数据集以及MovieLens数据集进行仿真实验,论证改进的合理性。在上述改进算法的基础上,本文实现了一种适用于大数据环境的推荐引擎平台架构模型。具体搭建过程采用了现在最流行的分布式大数据框架Hadoop,以及机器学习框架Mahout,并对Mahout中的基于项目的分布式协同过滤算法的改进方案进行了实现。本系统在设计时遵循面向对象的设计原则,兼顾了系统的性能,API透明化等。最后,通过对关键性能的用例测试,确保了推荐平台的性能需求。
其他文献
戴维·佩珀在阐述马克思主义自然观的基础上,通过对生态马克思主义与绿色无政府主义的比较分析,揭露了绿色无政府主义的缺陷和弊端,提出绿色分子应当以马克思主义为指导,实现
高校学报是计划经济的产物,它在现行的市场经济体制下显露了种种弊端。通过分析学报发行量不足的原因,大多数学报无法成为核心期刊的原因及高校教师的投稿取向,得出学报的办
研究集群攻击下的控制传感网络稳定控制算法,可以提高控制系统的稳定性。外部集群攻击下的控制传感网络失稳PID控制难以满足高精度控制要求,无法达到理想的控制效果。提出一种
为建设广播电视大楼新的播出控制系统,结合当前电视高清化、网络化、播出系统自动化等技术的发展方向,江阴电视台开始着手研究安全、实用和符合江阴电视自身发展的播出系统需
目的:观察温针灸、电针、中药联合治疗Bell’s面瘫风寒袭络证的临床疗效。方法:根据疾病诊断标准和证候诊断标准,确定20例Bell’s面瘫风寒袭络证病例,均运用温针灸、电针、中
<正> 兰××,男,76岁,住广州恤孤院路,原籍四川新津人,美侨兰某之父,身体尚健,但素患有前列腺肥大。1681年到成都探亲,当时成都盛行服红茶菌,民间称为“海宝”。有亲戚介绍他
随着中国市场经济的逐渐成熟,餐饮服务也以前所未有的速度蓬勃发展,成为中国经济的新增长点。但由于餐饮单位与消费者之间存在信息不对称,部分企业肆意违法添加、制假售假,由
行政许可是指在法律一般禁止的情况下,行政主体根据行政相对方的申请,经依法审查,通过颁发许可证、执照等形式,赋予或确认行政相对方从事某种活动的法律资格或法律权利的一种
在我国医疗保障体系不断完善的过程中,医院管理水平得到快速提升,给医院会计人才管理提出了更高要求,以充分发挥医院会计人才的作用,真正实现医院会计人才的有效建设。医院会
遗嘱是自然人生前作出的财产处分于其死后发生法律效力的单方法律行为。遗嘱的有效要件是对遗嘱过度自由的限定,具有保障遗嘱的真实性和维护家庭伦理的两大功能。遗嘱有效要