【摘 要】
:
序列推荐(Sequential Recommendation)根据用户的历史交互序列预测用户的下一次交互物品,由于序列中复杂的物品依赖以及用户的多方面兴趣,想要准确预测用户的下一次交互的物品十分困难。现有的工作将序列中的每一个交互物品视作一个兴趣单元,并应用了最新的深度学习技术来学习到用户兴趣的统一表示。虽然这些方法在实验中取得了较好的效果,但它们仍存在一些缺陷:1)一个向量不足以表示用户多方面的
论文部分内容阅读
序列推荐(Sequential Recommendation)根据用户的历史交互序列预测用户的下一次交互物品,由于序列中复杂的物品依赖以及用户的多方面兴趣,想要准确预测用户的下一次交互的物品十分困难。现有的工作将序列中的每一个交互物品视作一个兴趣单元,并应用了最新的深度学习技术来学习到用户兴趣的统一表示。虽然这些方法在实验中取得了较好的效果,但它们仍存在一些缺陷:1)一个向量不足以表示用户多方面的兴趣,一些潜在的用户兴趣会被忽略;2)用户的兴趣是多粒度的,单独的物品可能反映用户对某一物品的偏好,而一系列的物品反映了用户的一般兴趣,这样多粒度的用户兴趣无法被现有的模型所捕捉;3)由于位置嵌入矩阵与注意力机制的使用,模型会更倾向于关注近期的交互序列,且无关的物品仍会获得很小的注意力权重,引入噪声。为了解决这些缺陷,本文提出了基于循环神经网络的多记忆序列推荐模型MiGRU4Rec和基于胶囊网络的多粒度兴趣序列推荐模型CAN。随后,本文设计实现了多兴趣序列推荐系统,提出模型内部细节的可视化方案,使得研究者能够对模型在推荐过程中的内部机制有一个全面的了解,并对CAN模型的推荐过程进行优化,降低了模型的计算开销。本文主要贡献如下:1.基于循环神经网络的多记忆序列推荐模型MiGRU4Rec针对现有序列推荐方法无法显式建模用户多兴趣的问题,本文提出了MiGRU4Rec模型。在GRU4Rec模型的基础上,对门控单元进行改进,利用记忆矩阵中的多个记忆槽来存储用户不同时刻的隐状态,其中隐状态中的每一个记忆槽都代表着用户的某一兴趣,使得模型能够捕捉用户多方面的兴趣。此外,MiGRU4Rec模型捕捉了用户自身对于不同兴趣的偏好,引入了用户个性化的信息。本文通过实验证明了所提出模型的有效性,在推荐效果上,MiGRU4Rec比现有的方法有2%-5%的提升。2.基于胶囊网络的多粒度兴趣序列推荐模型CAN在捕捉用户多兴趣的基础上,针对现有序列推荐方法没有考虑到用户兴趣多粒度特性的问题,本文进一步提出了CAN模型。CAN模型将用户交互序列分成两部分,对用户的长期序列进行粗粒度的建模,抽象出用户的多兴趣;对用户的近期序列和多兴趣进行细粒度建模,充分利用交互序列中的信息。CAN模型在捕捉不同粒度的用户兴趣的同时,缓解了现有模型倾向于关注最近的近期交互,以及无关的物品仍会获得较小的注意力权重从而引入噪声的问题。本文对提出的CAN模型在三个数据集上做了详尽的实验,验证了模型的推荐性能,在各项推荐系统的指标上,CAN比现有的方法有4%-12%的提升。另外,本文通过一个案例探究了模型在训练过程所学习到的用户兴趣信息。3.多兴趣序列推荐系统针对目前研究者无法知晓模型在训练过程中学习到了哪些信息,以及无法有针对性地对模型进行改进等问题,本文设计并实现了多兴趣序列推荐系统,并将CAN模型部署到线上,验证了模型的效果。除了推荐系统主要的功能之外,本文通过可视化模型在推荐过程中的内部细节,使得研究者对模型的运行机制有一个深入的了解,辅助模型的设计与改进。另外,针对系统处理长序列效率低的问题,我们改进了CAN模型的实现方式,将用户的兴趣预先存储,减少在线计算开销。
其他文献
汉字具有类别众多和形近字繁多等特点,而且汉字的书写风格各不相同,这导致脱机手写汉字识别任务存在可探索的空间。近年来,深度学习发展迅速,深度卷积神经网络模型在脱机手写汉字识别任务上发挥着重要的作用,但是该模型通常需要大量的训练样本。对于手写汉字来说,除常用字外,其他汉字的样本不够充足,这给识别任务带来了一定的挑战。针对上述问题,本文从印刷体更具规范性的角度出发,使用印刷体帮助和指导脱机手写汉字的识别
自20世纪90年代以来,随着计算机与网络技术的飞速发展,在线学习当前已经变成了企业培训的一种主要趋势,其显著优势为海量信息、超时空限制、灵活方便及成本低廉等。在线学习以网络和信息技术为媒介,在人力资源培训领域的应用也日益广泛和深入。尤其是在新疫情环境下,在线学习与培训成为企业人才培养的关键载体,也是企事业单位培训的重要工具,因此,在线学习平台的创建越来越变成企业青睐的新型培训模式。显然,随着现代技
在半导体科学领域中,材料和器件的光电特性一直是研究的重点之一,如何对半导体材料或器件进行高精度、高效率的测量也是长久以来研究的课题。半导体材料常见的电学测量方法有变温I-V特性测试方法和范德堡测试法;常见的光电学特性测量有暗电流和光电流谱表征方法。本论文根据实际应用测试的需求,设计和搭建了一套面向半导体材料和器件的光电学特性测试的解决方案,即半导体变温霍尔及光电流谱集成测试系统,该系统由三个部分组
超材料是一种新型人造材料,它的主要特点是尺寸远远小于工作波长。超材料的物理性质不依赖于材料的参数,而是取决于人工设计的结构,超材料与电磁波作用时可以产生一些天然材料无法产生的奇特物理现象。超表面是超材料的二维形式,电磁特性和超材料一致。与三维块状的超材料相比超表面是超薄材料,弥补了超材料体积大、不利于集成的缺点,目前被广泛的研究。随着集成系统的飞速发展,对超表面的研究不仅停留在实现单一的频率和功能
多目标跟踪作为无人驾驶领域的一项核心技术,伴随着无人驾驶技术逐渐走进人们的视野,越来越多的研究人员也投身到了多目标跟踪领域进行更深层次的探索。经过长时间的技术积淀,多目标跟踪在交通安全、虚拟现实和无人驾驶等领域已经开始了应用,同时也展现出了巨大的潜力。如今目标跟踪的相关技术已经应用到了实际的生产生活中,为人们的生活带来了便利,提高了人们的生活质量。作为计算机视觉领域的一项基础工作,随着深度学习与卷
随着时间推移和5G技术普及,互联网技术在各行各业中得到推广,这也使得电梯制造商在市场营销过程中逐步引入智能网络的理念。在新社会环境下,商业电梯制造商所面临的业内竞争十分激烈。随着社会经济的不断发展,市场改革的不断深入,也推进了企业市场营销的改进和完善,在竞争激烈的市场环境下,如何提升市场营销的水平已是每个企业发展中重点关注的问题。本次研究结合以上背景内容,梳理国内外学术界现有对于电梯制造商相关的营
随着我国全社会用电量持续不断地增长,输电线路的数量以及覆盖范围也在逐年攀升扩增,绝缘子在输电线路中担任着机械固定、支撑线路以及实现电气绝缘等多种功能,拥有着至关重要的地位,若不及时检测更换故障绝缘子,会导致电力系统短暂奔溃并且造成一定的经济损失。由于输电线路大多处于山大岭等远离城市的地方,若采用巡检人员实地勘察的巡检方式,不仅安全系数低成本还高。目前部分省市已逐步采用无人机拍摄获取巡检图像,但由于
区块链利用拜占庭容错协议以及密码学技术保证节点间数据一致性和不可篡改,在互不信任的多方间实现安全的数据共享,避免了数据伪造、丢失等问题。近年来,区块链广泛应用于各种存证场景并发挥重要作用,如司法鉴证、防伪溯源等。基于区块链的存证应用种类丰富,其过程可概括为证据上传、证据共享以及证据查询三阶段。然而,交易数据信息简单、语义表达能力弱,系统提供的接口单一且系统吞吐低,如何从功能与性能两个维度改进当前基
随着循环神经网络(Recurrent Neural Network,RNN)的应用更加广泛,对抗序列的存在给这类安全攸关应用构成了极大的威胁,其中包含自动驾驶行为预测模型。RNN对抗序列生成是一种提升RNN鲁棒性的方法,然而目前现有的RNN对抗序列生成方法普遍存在着低效的问题。因此,针对上述问题,围绕自动驾驶行为预测模型,提出了一种基于权重自动机(Weighted Finite Automaton
气象条件是人民日常生活和农业生产的重要影响因素,随着各类气象灾害的频繁出现,人民群众的生命财产安全受到了严重威胁。因此,气象监测和预测变得越来越重要。随着传感器技术和通信技术的进一步发展,气象监测从人工记录数据逐步转为自动化记录和管理数据。气象数据的准确监测是开展气象工作的基础,也是准确预测各种突发性灾害天气的依据。目前市场上的气象监测系统,往往存在网络化能力不高、自动化能力欠缺以及设备部署复杂等