基于评论的推荐模型设计与实现

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:skybabay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来互联网行业发展迅猛,数据量呈指数式增长,信息过载问题也日益严重。推荐系统作为一种解决手段已被广泛采用,推荐系统可以帮助用户根据历史记录中找到用户自身偏好。这种便捷、智能的系统已在用户中非常流行。随着推荐系统的发展和企业间的竞争,提高推荐系统的准确性已成为企业增强核心竞争力的关键。推荐系统通过信息过滤为人们提供有价值的信息,基于矩阵分解的推荐模型已被广泛应用于推荐系统中。但是在数据稀疏程度高时,这种模型的推荐效果不佳。为了缓解数据稀疏的问题,许多推荐模型利用了附属信息,基于评论的推荐模型是其中一种。它将评论信息作为辅助信息来提取用户特征和项目特征,缓解数据稀疏带来的冷启动问题。但是这些模型普遍没有考虑评论中单词或短语的权重以及评论中的序列信息,因此推荐的质量受到限制。同数据稀疏问题一样,数据孤岛问题也会导致推荐效果受到影响。由于商业竞争和数据隐私等因素导致许多业务类似的公司之间数据不共享。因此在推荐时会因为单一公司数据量和数据类型不足影响推荐效果和用户体验。解决这种数据孤岛问题可以采用联邦学习和推荐系统相结合的方法。基于联邦学习的推荐模型采用分布式结构联合各个不同客户端的数据,使得推荐模型能利用更多的数据类型进行模型训练以提高推荐性能。针对上述推荐系统存在的问题,本文从以下两个方面进行研究:(1)基于局部注意力和GRU的推荐模型。本文提出了一种结合局部注意力和门控循环单元的推荐模型(Deep Recommendation Based on Local attention and GRU,DLAG)。DLAG模型的思路如下:首先使用局部注意力为评论中的单词或短语分配权重。其次将带有权重的评论信息送入卷积神经网络提取评论特征。得到用户特征向量和商品特征向量后再利用双向门控循环单元提取出评论之间的序列信息,并生成最终特征向量。最后,利用神经协同过滤算法预测用户对商品的评分。该模型通过对评论的单词进行加权和提取序列信息的方式缓解数据稀疏的问题。通过对三个不同的数据集进行训练,实验结果表明,DLAG模型在特定数据集上的推荐性能优于其他模型。(2)基于联邦学习的推荐模型。用户的购买数据普遍分散在各个网购平台,而组成这些购买数据的特征相似,它们能映射在同一特征空间,这样就为联合这些数据训练推荐模型提供了方便。为了使DLAG模型在这种数据分散情况下推荐效果更佳,本文提出利用联邦学习的思想训练DLAG模型(Fed-DLAG),模型采用的算法为联邦平均算法(Fed AVG)。该算法需要多个客户端和一个中央服务器共同协作完成推荐模型的训练。首先中央服务器初始化模型参数并为各个客户端分配权重,其次中央服务器在客户端上传梯度时根据权重进行加权汇总,最后再向各个客户端分发中央服务器更新后的参数。这一过程会循环多次直至模型收敛。本文在此基础上增加了差分隐私算法来实现上传梯度时的私密性,并在模型训练时控制客户端训练的轮次,减少了多余的通信成本。实验结果表明,Fed-DLAG模型能够保证用户数据隐私的情况下与DLAG模型的推荐性能相当。
其他文献
我国的综合性档案馆是集中管理档案的文化事业机构,承担着传播档案文化的重要使命,肩负着利用馆藏档案开展宣传教育活动的职责。因此,综合性档案馆网站作为建立在因特网上的档案信息服务平台,在其建立之初,即被赋予了教育宣传功能,与此同时,教育服务模块也成为综合性档案馆网站不可或缺的一个重要构成部分。档案馆网站教育服务模块可通过多种形式的档案文化资源服务,有效地发挥档案价值,不仅帮助人们更深切地理解档案、档案
生命医学领域在本世纪以来得到了全面且快速的发展,当前的生物信息学结合数理统计学已经为人类健康事业做出了巨大贡献。在这个生物大数据的时代,全基因组关联研究(Genome-Wide Association Study,GWAS)出现了。这种方法是以单核苷酸多态性(single nucleotide polymorphism,SNP)作为分子遗传标记,以发掘与生物体遗传疾病以及重要的生理性状相关的突变基
随着供销社深化综合改革,为了使供销系统成为与农民连结更紧密、为农服务功能更完备、市场化运行更高效的合作经济组织,对供销社系统的干部职工在各方面工作上均提出了更高更全面的综合要求。而由于传统人力资源在管理方面存在不足,不能更好地满足供销社综合全方面的深化改革、不能有效地促进经济健康发展的要求,鸡西市供销系统内部培训是人力资源管理工作的重中之重,本文从鸡西市供销系统内部培训的现状分析,指出鸡西市供销系
通过变量变换,非线性系统中的许多偏微分方程都能够被写成Hirota双线性形式,这对于此类方程的求解来说,无疑是一个非常有效的工具.同时,Hirota D-算子在非线性偏微分求解中也扮演着非常重要的角色,马文秀教授提出了一种新的双线性微分算子D_p,其中p为素数.研究发现线性叠加原理和贝尔多项式可以在相应条件下应用于相应的双线性微分方程.因此,我们利用p=3下的双线性微分算子D_3的定义及性质推导出
当前逐渐进入到信息化发展的时代,互联网技术已经在各个不同的行业当中得到渗透和应用,并且逐渐转化为一种商务模式,即电子商务模式,逐渐出现了跨境电子商务企业。它经过迅速的发展和演化,不仅会对市场经济的迅速发展以及跨境电子商务企业规模的扩张和发展有很大程度的推动作用,同时还可能会促使财务风险因素逐渐出现。
"双减"政策下建设高品质课堂,符合内涵发展的理念,凸显课堂教学的价值,破解教学实践的难题,应实现面向全人的教学目标,全纳参与的教学方式,师生共生的教学创新,家校共赢的教学成效四个特征,需要坚持结构性改革的总体方法,着力文化、课程、评价、教师、治理等关键性要素的统筹突破。
2019年9月26日下午,以"优化叙事,浸润识史"为主题的教学研讨、展示活动在上海市徐汇中学崇思楼小礼堂隆重举行。本次活动由上海市历史学科攻关基地、普陀区历史名师工作室和徐汇区历史名师工作室联手打造,也是华东师范大学历史系"诚之课堂"系列活动之一。作为姚虹老师领衔的名师工作室的一员,我有幸与鲍丽倩老师基地学员徐惠华老师开展同课异构,课题是统编版教科书《中国历史》第四册第七课"伟大的历史转折"
期刊
教学思路分析"伟大的历史转折"是八年级历史下册第7课。本节课属于第三单元"中国特色社会主义道路",上承第二单元的"文化大革命",下启改革开放新时期,在教科书中具有承上启下的重要作用。本课围绕中共十一届三中全会而展开,首先是中共十一届三中全会召开的背景,由于"文化大革命"后当时的领导人提出"两个凡是"的方针,引起人们的普遍不满,继而引起一场真理标准问题的大讨论,为中共十一届三中全会的召开奠定了
期刊
郭沫若先生曾指出,"教育的目的就是让学生养成用自己的头脑来想,用自己的眼睛来看,用自己的双手来做"的习惯,并且"能培养独创性和唤起对知识的愉悦感"。罗杰斯认为,通过"同伴教学""分组学习""交朋友小组"和"探究训练",不仅可以促进学习者对知识的掌握,还可以培养自信心、责任心、合作能力等,发展其自主性、创造性和探究精神。新课程改革要求深
期刊
随着素质教育理念的不断深入,越来越多的教师开始重视起,在高中阶段对学生的核心素养。而对高中的历史教学,教师想要在教学过程中为学生融入核心素养的培养内容,不仅要转变在传统基础上对学生进行历史文化意识的培养,还应当将历史学科核心素养中所包含的历史学科理论知识,和背后相关的文化价值意义融入到教学过程中,并且教师应当注意在教学过程中以核心素养为基础,明确教学目标和教学内容,帮助学生建立正确的价值观。