融合属性和评论的可解释推荐模型研究及应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:sxdinfo958
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今的信息化社会,人们每天要面对着海量的信息并进行筛选。如何在复杂的数据中寻找到自己最关注的信息成为了一个重要而急迫的问题。个性化推荐系统作为筛选信息的核心技术,一直受到学者和研究人员的密切关注。传统的个性化推荐技术在推荐准确性方面已经取得了成功。但这些传统的推荐算法具有黑盒模型的不可解释性,深度学习在这方面尤其明显。“系统应如何向用户解释这些建议”这一基本问题尚未引起足够的重视。缺乏透明度使用户陷入两难境地:用户只能通过采纳建议的措施(例如购买排名靠前的商品)来评估推荐质量,但是推荐系统应该首先让用户建立对系统的信任。基于这些原因,推荐的可解释性已经变得和准确性同等重要,如何研究出准确性和可解释性效果同样好的推荐模型已经变成当前的热点问题。本文融合了属性和评论两种常见信息,以推荐系统准确性和可解释性作为研究重点,进行了以下工作:(1)提出了一种新的融合属性和评论的可解释性评分预测推荐模型(NERAR)。该模型融合了属性特征和评论特征的信息,使用基于树的模型从辅助信息中学习属性特征,然后使用时间感知的门控循环单元(T-GRU)对用户当前评论特征进行建模;利用卷积神经网络(CNN)处理商品评论特征。最后利用因子分解机(FM)融合用户和商品向量得到最终结果。在多个评论和属性的融合过程中,本文使用了目前比较流行的注意力机制来融合多种信息,和简单的平均求和的算法相比,注意力机制更符合同类型信息对于用户的不同吸引力特性,不同的信息在用户最后对商品的评分过程中也有着不同的作用。最后根据学习到的注意力权重来选取对应的信息作为推荐的解释。在Amazon数据集上进行的大量实验表明,我们的模型在准确性方面优于最新的推荐模型。实验给出的例子也表明我们的模型可以提供充分的解释。(2)将可解释性推荐模型应用于吉林省重点科技研发项目“大数据和移动互联时代下的快速知识共享系统研究、开发和应用”。模型利用论文中的摘要信息作为模型中的评论文本信息,同时利用用户和商品本身的属性信息得到推荐结果和对应解释,取得了良好的效果。
其他文献
由于能源危机和环境问题,新能源的开发迫在眉睫。太阳能作为取之不尽、用之不竭的新能源,具有巨大的发展潜力。因此,大力发展太阳能电池势在必行。钙钛矿电池作为第三代太阳
圆极化天线由于在抗干扰性、可以同时作为收发天线等方面的优点而被广泛应用。通信系统频段作为一种资源,面临着日渐紧缺的困境,如何在有限的频谱资源下尽可能提升通信容量是专家学者正在探究的方向,本课题致力于研究在多个频段产生圆极化辐射特性,保证各自频段独立工作且具有较小的高低频中心频率比,具有重要的研究意义和工程价值。本课题旨在探讨多频左右旋的圆极化天线以及降低频率比的方法。本文的研究内容包括:第一,论文
基于中国制造2025与工业4.0的背景下,机器人在航空航天、海洋装备制造等领域中得到广泛的应用。目前,现有的通用型装配机器人大多以串联关节型工业机器人为本体,该类型机器人仅适用于轻小型工件的对接和装配,由于外界环境对机器人末端施加力和力矩,致使其在对接与装配过程中运动不平稳、精度不高。本文针对此问题,结合吉林省科技发展计划项目“具有自主定位导航的大工件柔顺装配对接机器人”,搭建以并联六自由度机器人
党的十八大以来,我国经济社会发展、尤其是地方农村发展在各方面各领域都取得了优异的成绩。十九大报告中指出“实施乡村振兴战略,农业农村农民问题是关系国计民生的根本性问题,必须始终把解决好“三农”问题作为全党工作重中之重。”[1]实施乡村振兴战略。借着乡村振兴的东风,B市通过组建具有投融资性质的皎月公司,结合地方优势资源和政策红利,发挥资源资产的金融杠杆撬动作用,试图破解制约区域经济发展的资金瓶颈和产业
近年来,限域离子液体在催化反应和气体捕捉中的应用备受关注,其优异的特性展现出良好的应用前景。但是关于限域离子液体的模拟工作很少,并且大都集中在分子动力学性质方面,很
在最近二十年间,世界进入互联网时代,人们的线上社交活动与线下生活文化完全交织在一起,人们接受信息的方式也从被动转换为主动,每个人都成为了信息的挖掘者与传播者,各种社交媒体应运而生。微博作为国内主流网络社交媒体聚积了数亿用户,在上面用户可以对网络上新发布的政策、工业产品、时事热点等发表自己的观点立场,如何在特定目标话题下有效的对用户立场进行判断成为网络舆情分析的重要课题。微博文本具有网络化、噪音多样
目的:卫生系统反应性是指卫生系统对个体改善非健康方面普遍合理期望的认知和适当反应。本研究通过了解广州市属三级医院卫生系统反应性的现状,分析当前广州市居民对市属三级医院卫生系统反应性评价中存在的问题并探讨其影响因素,为进一步完善和提高医疗机构特别是三级公立医院的卫生系统反应性提供科学依据。对象:本研究采用判断抽样的方法,首先从广州市属15家三级医院中抽取5家医院(3家综合医院、1家专科医院、1家中医
近年来,知识图谱的构建和应用迅速增长。知识图谱是指其节点是现实世界中的实体并且边是实体之间的关系的网络,表示为三元组形式(头实体,关系,尾实体)。这样由三元组形式的大量事实组成的网络建立了人类知识的结构系统。人们已经创建了大量的知识图谱,例如YAGO,NELL和Freebase。并且人们成功将其应用于很多领域,从语义解析和命名实体消歧到信息提取和问答。虽然这种结构能有效地表示结构化数据,但它却很难
随着人类社会的发展,越来越多的智能产品进入了我们的生活。而SIP协议由于其灵活开放的特点,被许多的智能设备采用为信令协议。在流媒体服务器方面,主要有HTTP渐进下载式服务器和基于RTSP的实时流媒体传输服务器,基于SIP协议的智能设备系统通常采用后者。但由于SIP协议只规定会话开启的方式,使得对于不同的智能设备系统的音视频编解码流程和传输方式可能存在很大的不同,极不利于终端的解码模块开发与服务器的
知识图谱是从大量事实中提取出来的。它大致分为两类,一类是从维基百科等知识库中提取的实体及其之间的联系;另一类是从大量页面中抽取的具有实体关系的三元组,这样的三元组内容更加丰富,也使得噪音较多。随着这些知识图谱的出现,人们开始利用有效的方法来获取知识图谱中的大量有价值的内容。为此,人们提出了许多查询语言。但是,这些语言中的语法不易被人们理解,因此,提出了许多基于知识图谱的问题回答算法。在人工智能领域