基于网络评论和行为序列化信息的用户兴趣挖掘算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:ahjockey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户兴趣爱好建模是推荐系统中的研究热点,它要求从用户的购买记录中准确识别用户的兴趣爱好并精确提取相关兴趣特征。用户兴趣爱好建模的结果直接决定推荐系统后续的决策,因此,如何从用户交互数据中提取出用户兴趣爱好成为一个十分有价值的工作。其中,用户行为序列和评论信息是用户交互记录中的两种重要数据信息。用户兴趣爱好建模根据预测的目标不同可以分为两种。一种是评分预测,预测用户对未购买商品的评分。评分是精确的数据,因此这是一种显示的反馈预测问题。目前大多数方法使用评论信息来增强用户的兴趣表达。另一种是点击率预测,预测用户对广告的点击概率。这是一种隐式的反馈预测问题。目前大多数方法通过对户行为序列信息进行建模来提取用户爱好特征。本文在对基础技术学习的基础上,着重研究并提出评论信息的提取方法和序列化信息的建模方法,主要研究内容如下:在评论信息提取过程中,目前方法仅仅利用两个分开的注意力机制来分别判断用户和商品建模过程中每条评论的有效性。忽视了每条评论的有效性是动态的,并且取决于目标用户和商品对的事实,这可能造成无法有效的对用户爱好和商品特征进行建模。本文利用评论层级的动态主题协同注意力机制来协同的为用户和商品中的每条评论赋予相应的权重分数。同时,由于评论数据和评分数据的稀疏性,本文采用由商品的类别特征和用户共同购买信息组成的异质信息网络来缓解数据稀疏造成的冷启动问题。实验结果表明,与基线方法相比,该方法在准确率上提高2%到7%,并且在稀疏的数据集上也有很好的效果。针对当前点击率预测方法忽视用户兴趣爱好偏移及用户短期爱好时效性等问题,本文提出一种联合多重通道记忆网络和自注意力机制的点击率预测方法。一方面,自注意力机制用来挖掘用户短期兴趣爱好,它按照时间间隔把整个点击序列划分为不同的session,然后利用用户最近一次session内点击序列来表示用户短期爱好。另一方面,多重通道的记忆网络用来挖掘用户长期兴趣爱好及兴趣爱好偏移情况。其中,多重通道用来获取用户对同种类别物品兴趣爱好的偏移情况;记忆网络用来挖掘用户长期的兴趣爱好。相比较传统的基于RNN的序列模型,记忆网络不仅具有更好的记忆存储能力,而且具有更高的可解释性。最终通过实验表明,本文的模型在准确率上与基础方法相比较有所提高。
其他文献
随着互联网的发展,用户需求越来越复杂,需要向用户提供的服务越来越多,如何能够更快速地给用户提供质量更优的服务变得至关重要。对于软件开发人员来说,在明确用户需求后高效地完成多个用户服务部署的同时,使得服务可快速迭代和易于管理维护成为一个亟待解决的问题。针对上述问题,本文实现一种基于Web的Docker持续集成部署设计方案,该方案以软件开发人员和服务部署人员的共同要求为指导,借助持续集成(Contin
临床上抗生素不合理的大量使用,导致耐药菌和多重耐药菌的大量出现,使得传统抗生素失去抗菌疗效。寻求一种能够使传统抗生素恢复抗耐药菌效用且在短时间内提高其抗菌活性的方法是一种解决细菌耐药性的很好途径。本课题组前期发现碲化铋(Bi_2Te_3)和二氧化碲(Te O_2)分别与β-内酰胺类抗生素头孢噻肟(CTX)具有协同抗耐甲氧西林金黄色葡萄球(methicillin-resistant Staphylo
随着互联网飞速发展,信息传播更迭速度快,及时有效的信息传播变得越来越重要。近几年随着媒体融合的概念提出,传统报纸、电视、广播媒体在积极拥抱新的媒体形态进行融合发展。从2014年党中央出台《关于推动传统媒体和新兴媒体融合发展的指导意见》开始,媒体融合已经在经营管理、渠道建设等方面取得令人欣喜的成绩,但同时也在技术、版权等方面存在很多急需解决的问题。例如在技术平台方面的问题主要在于技术更新慢、发布管理
随着经济的发展,越来越多的投资者涌入资本市场中,由于定向增发的审核并没有比其他融资方式更严苛,且没有要求上市公司在过去一段时间内的业绩要符合某种标准,因而定向增发逐步超过配股和公开增发成为上市公司普遍采用的主流再融资方式。由于证监会要求实施定向增发的上市公司必须提供无保留意见审计报告,为了达到引进战略投资者、缓解财务压力、规模扩张等目的,上市公司因为想得到更“干净”的审计报告铤而走险与审计师合谋进
旅游业是关系民生的幸福产业,是一二产业蓬勃发展的促进力量。新时代以来,我国经济发展取得重大成就,人民生活水平显著提高,人们对于精神愉悦程度的追求日益突出,旅游业在需求“拥挤”的驱动下显现出供给“拥挤”趋势,并在需求与供给的二元结构中蓬勃发展。据国家旅游局统计,2019年全国旅游总收入达10.94万亿元,对GDP贡献率为11.05%,旅游业提供就业岗位7987万个,占全国就业人口的10.31%,旅游
集中供热是我国北方区域冬季采暖的主要方式。伴随着我国城镇化的高速推进,北方城镇建筑面积不断增长,北方城镇集中供热面积亦随之快速增长。2017年中央政府印发了《北方地区冬季清洁能源取暖规划(2017-2021)》,中国供热行业进入了清洁能源改造的快速上升期。与此同时,国家对环保治理的重视和对污染源的管控加强,对供热企业生产环节中的节能环保、低碳高效提出了更严苛的要求,三供一业”移交政策对经营供热服务
分子印迹已经成为研究分子识别与调控的重要手段。由于模板分子的使用,分子印迹聚合物(molecularly imprinted polymer,MIP)含有大量识别位点,它们与模板一一配对,保留了对模板分子的“记忆”,具有较强的亲和性与特异性识别能力。分子印迹冰胶是在冰冻状态下合成的一种具有三维网状结构超大孔高分子材料,因为印迹位点为数众多,所以每一小块冰胶做成的膜电极都是“分子电容器”的巨大阵列,
面对输入及输出因素间具有复杂非线性关系的系统,传统分析方法往往显得无能为力,难以获得预期效果。随着智能分析方法的飞速发展,人工智能算法逐渐应用于各类工程领域复杂系统的预测分析。人工神经网络可以很好的逼近非线性函数,在数据预测中有着重要作用。Elman神经网络作为动态反馈网络的代表相较静态BP神经网络具有一定的优点,但仍然存在易陷入局部极值、预测精度不能达到预测要求的不足。本文利用改进的单体智能算法
方程应用题作为数学应用题的重点题型之一,在初中数学教学中占有重要地位,对培养学生用数学知识解决实际问题的能力,有着重要的作用。方程应用题的学习贯穿整个初中阶段,大学毕业后,笔者曾参与吉林省某项支教计划,到乡镇中学支教两年。通过.对所教班级学生情况的观察以及与其他农村学校教师的沟通,笔者得知,学生对方程应用题的理解较为困难。近年来,国内外对数学应用性的要求逐渐提升,我国亦提出了着重培养创新型、复合型
随着万物互联互通时代的到来,准确、可信、高度可用的网络时间是所有网络应用场景正常运行的基础。利用网络传递时间信息的方式吸引了越来越多的关注。网络时间同步不需要额外的同步设备便能够满足绝大多数业务时间同步的需求,具有成本低廉、应用广泛以及方便快捷的优势。另外,伴随着网络应用场景的多样化增加,催动着网络时间同步对可靠性、高精度等等的需求。本文意在搭建一套互联网时间服务监测系统,持续监测世界范围内互联网