【摘 要】
:
互联网技术的高速发展,极大地降低了人们获取信息的门槛,与此同时,全球互联网上每时每刻都在产生庞大的数据,人类社会已经进入了信息过载的时代。基于协同过滤的个性化推荐技术作为解决信息过载问题的有效手段,能够通过分析用户的历史行为,从海量的数据中挖掘出与用户兴趣相符的信息进行推荐。不仅帮助人们提高了信息获取的效率,而且也让信息能够精准的展现在对它感兴趣的用户面前,为企业带来了巨大的经济效益。在实际的应用
论文部分内容阅读
互联网技术的高速发展,极大地降低了人们获取信息的门槛,与此同时,全球互联网上每时每刻都在产生庞大的数据,人类社会已经进入了信息过载的时代。基于协同过滤的个性化推荐技术作为解决信息过载问题的有效手段,能够通过分析用户的历史行为,从海量的数据中挖掘出与用户兴趣相符的信息进行推荐。不仅帮助人们提高了信息获取的效率,而且也让信息能够精准的展现在对它感兴趣的用户面前,为企业带来了巨大的经济效益。在实际的应用中,传统的协同过滤推荐算法面临数据稀疏性和冷启动问题,导致算法预测的精确度以及运行效率偏低。为弥补协同过滤推荐算法的不足,本文提出了一种基于用户评分与评论的推荐系统方案,并在Spark平台上进行了实现。本文的主要工作包括以下几个方面:(1)提出了一种基于大数据预处理技术的物品特征提取方法。首先对用户评论的文本进行预处理,包括物品评论聚合,缺失评论填充,重复数据删除,评论数据格式转换,然后利用Word2Vec模型从预处理后的评论文本中提取物品特征,取得了较好的效果。(2)提出了一种基于用户评分与评论的推荐算法。首先引入用户评论的词频、评分、评论时间和评论帮助度改进物品特征,然后根据物品特征计算物品相似度,最后根据物品相似度预测用户评分,生成推荐列表。(3)在大数据处理平台Spark上完成了基于用户评分与评论的推荐系统的设计与实现,首先将推荐引擎分为在线计算和离线计算两个模块,实现了算法的并行化执行;然后在真实的亚马逊商品数据集上验证了基于用户评分与评论的推荐系统的有效性和可扩展性。(4)本文最后的实验结果表明:与多种经典的协同过滤推荐算法相比,本文推荐系统中提出的算法在平均绝对误差MAE指标上有一定优势,预测准确率与基于物品的协同过滤算法相比有较大的提高,总体上优于传统的协同过滤算法,能够有效缓解数据稀疏性和冷启动问题。
其他文献
【目的】脊髓损伤(Spinal cord injury,SCI)发病率高,死亡率高,致残率高,目前临床上尚无有效药物。细胞死亡是SCI继发性损伤重要机制。目前发现凋亡、坏死及自噬等死亡通路,均发挥不同程度的作用,铁死亡(Ferroptosis)是近年来发现的一种由铁依赖的脂质氧化损伤引起的细胞死亡模式。去铁胺(Deferoxamine,DFO)是一种临床上治疗铁过载疾病的药物,也是一种铁死亡抑制剂
目的分析A+C群流脑多糖疫苗引起的1例异常反应,探究预防对策。方法收集1例接种A+C群流脑多糖疫苗引起的异常反应的患儿的资料,对其发病经过、接种史、接种过程等进行回顾性分
中国博物馆学起步于上世纪初,落后于中国近代博物馆的发展,而且由于抗日战争的爆发进入了瓶颈期。在我国博物馆学术理论青黄不接的危难时刻,出现了一批敢为人先的学者,其中曾
本文采用滴涂法制备了还原氧化石墨烯/Nafion溶液修饰玻碳电极(rGo/Na-fion/GCE),用电化学聚合法将L-半胱氨酸(L-Cys)聚合在rG0/Nafion/GCE表面,得到Poly-L-Cys/rGO/Nafion/GCE。采用伏安法
随着我国教育的不断发展,班级管理问题日益成为学校教育的核心内容之一。我国中学班级管理中普遍存在"破窗"问题,因此从经济管理、教育心理和犯罪行为三个角度探究"破窗效应"
公路部门是交通行业一个重要部门,公路路政执法队伍则是这个部门重要的对外“窗口”,队伍建设直接关系到交通行业管理水平。近年来,各地公路管理机构不断完善管理体制机制,加大执
为了研究半挂汽车列车横摆稳定性控制问题,以牵引车和半挂车的横摆角速度为控制目标,通过牵引车和半挂车的差动制动控制来改善整车的横摆稳定性。提出了基于约束加权最小二乘
建立固相萃取-超高效液相色谱-串联质谱法同时测定热加工食品中14 HAAs种含量的方法。样品经过5%盐酸-甲醇酸化后均质,涡旋,超声提取,经混合型弱阳离子交换PCX固相萃取小柱富
海洋沉积物中的木质素是陆源有机碳输入的良好标志物,但在迁移埋藏的过程中会发生生物降解,对其指示作用产生影响。本文简要介绍了木质素的结构、指示参数、降解木质素的微生
目前,我国最重要的对外战略设计'一带一路'规划,旨在实现全球化体制下基础设施商流、物流、信息流、资金流和人心的沟通。基于全球化架构产业供应链(SCM)正成为MNF(