【摘 要】
:
许多推荐系统都使用评论文本作为辅助信息缓解数据稀疏和冷启动问题,但目前相关研究中使用的处理评论文本的深度模型(例如卷积神经网络和注意力模型)都会丢失文本的重要信息,而且使用全部评论文档也会令模型受到文档中低质量评论的负面影响。此外,通过将其他域学习到的知识迁移到目标域进行推荐的算法往往只考虑单一的源域,这也存在一些信息挖掘不完全的问题。基于上述问题,本文从单域推荐与跨域推荐两个角度进行建模,以胶囊
论文部分内容阅读
许多推荐系统都使用评论文本作为辅助信息缓解数据稀疏和冷启动问题,但目前相关研究中使用的处理评论文本的深度模型(例如卷积神经网络和注意力模型)都会丢失文本的重要信息,而且使用全部评论文档也会令模型受到文档中低质量评论的负面影响。此外,通过将其他域学习到的知识迁移到目标域进行推荐的算法往往只考虑单一的源域,这也存在一些信息挖掘不完全的问题。基于上述问题,本文从单域推荐与跨域推荐两个角度进行建模,以胶囊网络为基础,构建了两个推荐模型。首先,针对用户在目标领域存在历史交互的情况,提出考虑评论质量的自注意力胶囊网络评分预测模型:SACR。模型使用自注意力胶囊网络挖掘评论文档中的细粒度特征,使用用户和项目的编号信息标记低质量评论,并且将二者的表示相融合用于预测评分。模型还改进了胶囊的挤压函数,从而得到更精确的高层胶囊。模型解决了目标域评分数据稀疏的问题,以及低质量评论影响推荐准确度的问题。其次,针对用户在目标领域冷启动的情况,提出基于方面和胶囊网络的跨域评分预测模型:ACN。模型将源域和目标域中的每个用户和项目都用其对应的评论文档表示。模型改进了胶囊网络的映射矩阵,使用它挖掘用户和项目的多个方面。在此基础上通过注意力机制筛选出对目标域最重要的那些方面,并将其迁移到目标域进行预测评分。本模型可以学习并迁移不同源域以及多源域的知识,解决了用户冷启动下信息挖掘不完全的问题,并且可以提升跨域推荐的准确率。最后,将本文提出的SACR和ACN两个模型在现实世界数据集中与基准模型进行实验对照,证明了本文模型的有效性和准确性。
其他文献
本文提出了一个在量子电动力学(QED)腔场中传送未知的两原子纠缠态的方案。在这个方案中,一个三原子纠缠Greenberger-Horne-zeilinger(GHZ)态被用来作为量子通道。我们让两个原子同时与一个单模腔场和一个经典场相互作用。经过相互作用时间t后,再在原子1的态上执行一个旋转操作R,这样就可以成功地实现量子隐形传送,且成功机率为1.0。另外,本文可以忽略腔场的衰减和热场效应对本方案
众所周知,机器人系统被认为是一种典型的多输入、多输出的非线性系统,在实际的工作中,不仅会出现速度信息无法测量的情况,而且还会受到外部干扰、非精准测量、负载的变化、摩擦力和随机扰动的存在、以及没有进行建模的动态性等各个不确定性因素的影响。以上各种不确定性的因素会直接或间接地对机器人系统的轨迹追踪性能产生不好的影响,使系统变得不稳定。因此,深入探究机器人系统轨迹跟踪控制器的设计问题就具有更加重要的理论
随着信息技术的快速发展,每天都会出现海量的文本信息。通过人工挖掘信息中蕴藏的丰富知识费时费力,如何快速高效地抽取和利用海量信息中的知识成为人们关注的热点。信息抽取作为一种从非结构化文本中抽取结构性信息的技术应运而生,事件抽取是信息抽取中一个极为重要的任务,正在受到越来越多研究者的关注。事件抽取包括两个任务:事件检测和元素抽取。首先,事件检测的主要任务是基于文本中的触发词进行事件的分类,当前基于深度
目前在海面溢油遥感领域上,公认最好的探测技术之一就是海洋激光诱导荧光(LIF)探测技术。它通过发射激光到海面获得含各种成分信息的荧光,之后分析荧光信号可以得到海面溢油的范围、溢油种类以及溢油厚度等信息。然而单纯的LIF探测系统探测的是一个点,因此可获得信息有限,不能够获取到海面溢油的各项应测参数,而且目前该领域只是对溢油污染未乳化阶段连续薄油膜(d≤10μm)有可用的理论研究成果和探测方法,本文据
即时定位和构图(Simultaneous Localization and Mapping,SLAM)在虚拟现实、增强现实等领域有着广泛的应用。基于特征点的SLAM系统在弱纹理、光照变化剧烈和快速运动的场景中,很难提取到足够的特征点或者特征点分布不均匀,从而导致定位的失败,而线特征在上述场景有良好的表现,本文重点研究了点、线特征结合的视觉惯导SLAM算法。研究内容如下:首先,针对在弱纹理的环境中提
脑机接口(Brain Computer Interface,BCI)技术构建了大脑与外部设备之间全新的连接方式,已经应用于医疗、交通和娱乐等众多领域。基于脑电信号(Electro EncephaloGram,EEG)的BCI技术,由于其无创、时间分辨率高等特性,被广泛应用于BCI系统中。然而,在目前的BCI技术中,EEG数据标注的时间和经济成本较大,且EEG信号存在时变性和个体差异,导致BCI系统
无人驾驶技术正逐步发展并得到快速进步,旨在简化汽车的驾驶操作并提高驾驶系统的安全性。然而无人驾驶车辆的行驶路况并不是单一不变的,面对一些极端场合,无人驾驶车辆需要进行高速行驶,在遇到弯道或者障碍不能减速时,控制车辆进行漂移也是有效的解决途径,因此保证无人驾驶车辆进行稳态漂移并保证车辆安全性是极具意义的研究问题。本文以无人驾驶车辆为对象展开研究:首先,对无人驾驶车辆的稳态漂移动态过程进行动力学分析,
生成式对抗网络因其可以有效地学习数据的潜在分布,并可以生成高质量图像,逐渐在众多生成模型中脱颖而出,备受广大研究者关注。在图像迁移、视频生成、图像生成等很多应用领域中,生成式对抗网络均取得了丰硕的成果。本文针对生成式对抗网络的理论及其在图像生成应用中的问题进行了研究,包括提高生成式对抗网络的整体稳定性和训练速度,降低生成图像中噪音的产生。主要工作如下。首先针对由图像中存在大量冗余信息、和其本身的复
由于多智能体系统比单一智能体更能有效地执行任务,提高系统的故障容错性与鲁棒性,且具有较高的灵活性,现已被广泛应用于自动控制与人工智能领域。特别是关于分数阶多智能体系统一致性控制,受到了许多学者的关注。最近,关于连续分数阶多智能体系统,已有一些研究成果涌现。本文以分数阶间断多智能体系统一致性控制为研究对象,具体工作如下:首先,在无向拓扑结构下,将智能体分成若干组群,当系统内在动力行为函数间断且单调不
模糊控制在过去的几十年中得到了深入的研究,并被认为是分析许多非线性系统的重要媒介。近年来,T-S模糊技术被广泛应用于许多实际领域,引起了学者的关注。T-S模糊系统以IF-THEN规则的形式描述非线性系统,该规则利用模糊隶属度函数表示局部线性输入输出关系。T-S模糊系统不仅是一种有效的非线性系统控制方法,而且是一种充分发挥线性系统理论优势的灵活工具。在T-S模糊系统中,稳定性分析是一个重要的课题。系