【摘 要】
:
在信息化时代,数据爆炸式增长,实时数据资源在赋能经济社会生活高质量发展的同时也带来信息过载问题,人们从海量信息中筛选出感兴趣的内容显得尤为困难,推荐算法应运而生。它不仅能快速为用户定位所感兴趣的内容,节约用户筛选信息的时间,还能为信息提供者带来可观收益,推荐算法的研究由此受到广泛关注。但现有评分预测推荐模型仅利用评分数据,而用户和物品交互的评分矩阵往往极度稀疏,利用社交、时间等信息补充特征的研究却
论文部分内容阅读
在信息化时代,数据爆炸式增长,实时数据资源在赋能经济社会生活高质量发展的同时也带来信息过载问题,人们从海量信息中筛选出感兴趣的内容显得尤为困难,推荐算法应运而生。它不仅能快速为用户定位所感兴趣的内容,节约用户筛选信息的时间,还能为信息提供者带来可观收益,推荐算法的研究由此受到广泛关注。但现有评分预测推荐模型仅利用评分数据,而用户和物品交互的评分矩阵往往极度稀疏,利用社交、时间等信息补充特征的研究却忽略了具有丰富信息的评论文本,使用了评论的模型也有不足之处,比如未挖掘评论更深层的语义信息,未考虑用户和物品评论主题差异性等。针对以上问题,本文借助深度学习技术提出非对称局部-全局注意力推荐模型(Asymmetrical Local-Global Attention Model,ALGAM),主要研究内容如下:1)引入评论缓解数据稀疏问题。在用户和物品组成的评分矩阵中,有交互信息的数据只占极小部分,元素大都处于缺失状态,可用信息寥寥无几,数据缺失影响模型预测准确性。本研究通过引入评论文本信息来丰富用户和物品画像,利用神经网络模型挖掘文本中用户和物品特征,相比单纯使用评分信息的模型,能够在一定程度上缓解数据稀疏问题。2)利用动态词向量准确建模评论语义。自然语言文本是非结构化信息,有其自带的天然属性,如歧义性、进化性和高度抽象性等。如果使用静态词向量工具,则无法挖掘准确的语义信息,只能学习到浅表的含义。本研究采用动态词向量工具并结合微调操作不断优化文本表示向量,使得模型能够学到更深层次的语义信息,从而获得更为精准的文本向量表示。3)应用双重注意力多角度建模评论语义。评论文本撰写的用户不同,评论的质量良莠不齐,评论的信息量也有丰富和贫瘠的差异,每条评论的参考度应有所区别,不能一视同仁,同时评论与评论之间也蕴含着某些潜在的关联关系。本研究采用双重注意力从不同层面获取特征,其中全局注意力用于判断每条评论的重要程度,局部注意力用于捕获评论与评论之间的关联关系,从而提高文本信息利用的准确率。4)采用非对称方式差异化建模用户和物品画像。用户评论主题具有异质性,所描述的物品往往不同,而物品评论主题具有同质性,往往描述同一物品,因此从评论中获取用户和物品特征的方式要有所差异。与以往研究不同,本研究在评论级别上采用非对称方式对用户和物品建模。预测用户对物品打分时,用户肖像刻画参考当前物品特征,重点关注与物品特征匹配高的用户评论。而在评论级别上的赋权值,保证了用户评论中物品特征之间的独立性,从而获得用户在面对不同物品时喜好的变化。最后将本文提出的ALGAM模型,在亚马逊四个不同领域的数据集上进行评估,并将目前较为先进的深度学习模型(Neural CF、Deep MF、Deep Co NN、TARMF和AHN)作为基准模型,使用MSE(Mean Square Error)评估性能。实验结果表明,ALGAM表现更佳,相比于所有基准模型整体均有所提升,其中在Automotive数据集上MSE降低至0.452,验证了本文提出的模型能提高评分预测的准确性,继而提升推荐性能。
其他文献
质量是学校教育永恒的主题,是学校发展的生命线;教学质量始终是学校追求的目的,也是学校办学的生命力和竞争力;教学质量评价是促进学校教学质量稳步提高的重要途径,其一直受到教育研究者们的高度重视。目前,课程教学质量评价相关研究在一定程度上取得了相应的成果。但在课程教学质量评价过程中,往往不同评价主体对相同的评价影响因素会有不同的看法。这些评价主体对教学质量评价的侧重点是什么,这对教学评价的发展又会有什么
图像生成是计算机视觉领域的一大关键任务,在艺术创作、工业设计、影视娱乐、数字化模拟等行业具有广泛的应用价值。如今,随着各领域工业化进程的加快,对图像生成效率、质量的要求不断提升。近年来深度学习在计算机视觉领域取得巨大成功,与传统利用修图软件手动处理图像相比,基于深度学习的图像生成效率高、成本低并且功能完善。因此,基于深度学习的图像生成模型越来越受到研究人员的关注。基于上述背景,本文在深度学习框架下
跨境电商的出现和发展构建了全新的、全球的、自由的、开放的线上国际贸易新形态,成为对外贸易的又一新增长点。跨境贸易交易量快速增长的同时,跨境电商物流效率成为影响企业绩效的重要因素。为解决跨境物流周期长、时效性差、物流成本高、服务不周全等明显短板,海外仓模式应运而生。虽然,海外仓储物流模式有效地提高了物流效率,改善了售后服务,解决了许多通关和税收问题,但也面临着库存呆滞、海外仓服务商不达标、管理混乱等
随着互联网发展,工业生产行业也逐渐向智能化发展,然而工业控制系统(简称工控系统)接入互联网必然面临相关的网络安全威胁,而且工控系统受到攻击后会造成更大的安全危害,所以工业控制网络安全极大程度上关乎国家安全,因此工控安全领域出现很多安全防护手段,工控蜜罐就是其中一种。相应的,工控蜜罐识别成为工控领域攻防对抗的重要环节,攻击者若能提前发现工控蜜罐引诱设备,可避免落入引诱陷阱,从而有效隐藏攻击者的攻击意
新一轮科技革命推动了数字技术与产业的相互融合,给传统产业带来了新的发展机遇。随着我国数字经济相关政策的不断完善和数字技术的成熟,部分企业率先采取行动,运用数字技术创新产品和商业模式,并将其作为资源要素,与其他组织不断进行要素交换,进而形成了以数字技术为基础的生态型组织,在学术领域,尽管有学者关注到数字技术情境下的生态组织变化,但研究重点仍集中在平台生态等领域。本文将深入分析传统企业转型为数字商业生
2022年1月1日,《区域全面经济伙伴关系协定》(简称RCEP)的正式生效意味着中国对RCEP成员国对外直接投资进入了全新的篇章,预计将进一步推动中国对其成员国的对外直接投资,减轻中国对其直接投资过程中的不确定风险,同时也为中国政府高水平对外开放和企业“走出去”带来了新的挑战。因此如何在加强对外直接投资的基础上,提升对外直接投资效率、释放投资潜力,充分发挥对外直接投资效用,成为了中国对外开放和企业
自杀是全球性重大公共卫生问题之一,大学生自杀意念流行率高,危害大。研究表明,自杀意念个体的奖赏机制存在异常现象。研究也表明,同伴排斥是影响大学生奖赏机制的重要因素。然而,探讨同伴排斥对自杀意念大学生的奖赏机制的影响研究仍然非常缺乏。基于多元动机模型和RDo C(The Research Domain Criteria project)框架,从正价系统和社会处理系统出发,开展了两项研究:研究一探究同
等电聚焦法是研究蛋白质的一种有用的方法.它可把带有不同电荷的蛋白质分离开来.丝素多肽可以在pH梯度为3.5—10.0和4.0—6.0两种凝胶柱上进行等电聚焦以研究这些多肽的等电点.在凝胶柱上可以获得二十四条区带.这表明丝素是一个电荷不匀一性的蛋白质.最强的区带的等电点范围是pH4.58—5.00.根据这些结果,可以考虑用等电区来代替丝素的等电点.虽然丝素蛋白质至少可以检测到二十四条区带,但是我们仍
在数字变革的背景下,对外直接投资(简称为OFDI)是推动我国经济转型,实现经济高质量发展的重要途径,对构建以国内大循环为主体、国内国际双循环相互促进的新发展格局具有重要的推动作用。受逆全球化和新冠疫情的持续影响,国内外市场需求萎缩、政治风险增大,世界各国的对外直接投资增速下滑甚至出现负增长。然而,我国的对外直接投资却实现了逆势增长并位居世界第一,但显现出各省份发展不平衡状态。随着区块链、大数据、云
《全球数字经济新图景(2020年)》显示,韩国、日本数字经济占GDP比重超过40%,新加坡为37.02%,马来西亚为25%左右,越南、泰国、印度尼西亚低于15%,其余RCEP伙伴国均低于5%。RCEP伙伴国在政治、经济以及基础设施等方面明显的差异,无形中增加了我国对其出口贸易的风险与挑战。因此,考察RECP伙伴国数字经济发展水平的差异,并研究RECP伙伴国数字经济发展水平与中国出口贸易规模增长之间