【摘 要】
:
推荐算法在信息过载时代扮演着至关重要的角色。一方面,用户可以借助推荐算法从海量信息中寻找到自己感兴趣的事物;另一方面,信息提供者也能借助推荐算法使生产出的信息得到广泛的关注。然而现有的推荐算法的性能常常受限于以下问题:(1)数据稀疏问题:用户交互过的物品通常只占总物品数的一小部分,因此用于记录用户与物品交互的矩阵中大部分元素都处于缺失状态。此现象导致的数据稀疏性问题会增加模型对用户和物品建模的难度
论文部分内容阅读
推荐算法在信息过载时代扮演着至关重要的角色。一方面,用户可以借助推荐算法从海量信息中寻找到自己感兴趣的事物;另一方面,信息提供者也能借助推荐算法使生产出的信息得到广泛的关注。然而现有的推荐算法的性能常常受限于以下问题:(1)数据稀疏问题:用户交互过的物品通常只占总物品数的一小部分,因此用于记录用户与物品交互的矩阵中大部分元素都处于缺失状态。此现象导致的数据稀疏性问题会增加模型对用户和物品建模的难度。(2)无法充分学习表征问题:用户的评论质量良莠不齐。不充分的数据清洗会导致数据集中仍然存在不切题、信息量贫瘠的评论;同时评论之间通常也隐含着错综复杂的关联信息。从低质量的、未考虑相关性的评论数据中学习到的表征无法精确表达用户偏好和物品特征。(3)静态学习问题:一个用户所有评论的主题是异质的,即一个用户的所有评论通常包含了此用户对不同种类物品的偏好;而一个物品所有评论的主题是同质的,即一个物品的所有评论通常都在描述此物品本身的特征。这种用户和物品评论的差异,若使用完全平行的网络建模,将导致静态学习问题。针对上述问题本文的主要研究内容如下:(1)针对数据稀疏问题,本研究提出的两种模型均同时考虑了评分信息和评论信息。由于用户的文本评论是一种序列化、含有丰富语义的隐式特征,能够对评分信息进行补充,因此通过评论和评分同时进行推荐,能够在一定程度上缓解单纯利用数字评分所产生的数据稀疏性问题。(2)针对无法充分学习表征问题,本研究提出的基于Bert预训练模型的局部-全局感知注意力模型,该模型使用了两种不同层次的注意力机制对用户和物品进行建模:局部注意力机制能够考虑评论之间的内在联系;全局注意力机制能够尽可能减少劣质评论对模型性能的影响。实验表明,此模型能够获得比单纯使用评分的模型更好的性能表现,同时也优于使用传统的卷积神经网络和循环神经网络的模型,在一定程度上获得了更精确的用户和物品表征。(3)针对静态学习问题,本研究提出的基于Albert微调模型的动态双重注意力模型,在局部-全局感知注意力模型的基础之上,通过改进的全局注意力机制,解决了以往模型中由于使用完全平行的网络而导致的用户特征和物品特征无法交互的问题,通过将用户的特征矩阵与物品的特征矩阵进行注意力计算,动态地学习用户在面对不同物品时的偏好。实验表明,此模型学习到的表征更为精确且是动态的。最后,在亚马逊数据集(包含了四个子数据集)上的实验表明,本文提出的两种模型相较于基准模型(Neural CF,Deep Matrix Factorization,NARRE,DeepCLFM)均能够获得更佳的表现。
其他文献
眼球追踪在人机交互、医学检查、心理测试领域有着广泛的应用,近年来也备受国内外学者的关注。目前大部分相关研究工作主要集中在针对固定距离内的视线方向获取,且多为近距离视线跟踪。视觉深度是人眼所注视目标物与人眼的实际距离。获取视觉深度信息在自动变焦眼镜等头戴式装置以及眼控交互技术中的人眼意图识别领域有重要应用意义。如在自动变焦眼镜中通过获取人眼实际注视距离,自动控制眼镜光焦度,使人眼能够获取任意距离的清
双电机及多电机平台控制系统拥有适应性强、功率大和成本低等优点,被广泛运用在生产加工和生活中。而电机之间的同步控制性能直接影响电力设备的稳定与生产效率,例如升降加工平台、机床等设备。同步控制性能越差则系统稳定性越低,甚至会造成设备损坏。本文设计了一种基于双电机直流同步控制的升降平台系统。使用MATLAB工具建立的仿真模型包括电机数学建模、电流环设计和速度环设计,通过仿真实验对调速系统进行仿真验证。为
神经疾病的传统治疗方法包括药物治疗和手术治疗,药物治疗的弊端是副作用,手术治疗的弊端是风险较大。电刺激疗法因其疗效即时显著,受到越来越多的关注。本文分析了传统植入式神经刺激器的缺点,结合各种刺激脉冲的优缺点,并引入无线通信和无线电能传输技术,设计了一款基于蓝牙的植入式无线神经刺激器,最后对深度脑刺激电极的优化结构进行了多物理场仿真。脉冲发生器的刺激模块和控制模块分离,电极只与刺激模块相连,刺激模块
电梯是人们日常出行中常见的特种设备,随着中国对于电梯的需求日渐增加,电梯故障与维保问题也日益突出。针对电梯规模迅速扩大带来的电梯安全管理问题,本文设计了一种基于数据驱动的电梯远程智能运维平台。平台分为智能网关、云平台、故障预警系统三部分,主要功能包括数据大屏展示、电梯信息监控、电梯故障维保、电梯故障预测等,满足了电梯运维的相关需求,提高了电梯的维保效率和安全性能,实现了电梯的智能化维护。本文的主要
在现代电子系统中,大量应用的介电储能电容器介于电池和电化学容器之间,中和了两者的性能,具备电池的高能量密度特点的同时又拥有电化学容器的高功率密度,且存在较高的电场强度,充放电速率快等优异特性而得到了广泛的研究,特别适合用于快速产生大量脉冲功率的充放电电容器,如医疗除颤仪,汽车逆变器等。但是目前在许多的应用领域中,如混合动力汽车,深井的油气勘探,航天航空等,都对介电储能电容器提出了更高的标准,不仅仅
信息时代有大量数据需要存储在非易失性存储器中,这就对存储器提出了更高的要求,在这些存储器中,磁存储器件凭借着其存储密度高、存取速度快、功耗低、并且更微小型化的优势在众多存储器中脱颖而出。利用自旋轨道转矩原理的新一代的磁存储器需要克服如何在无磁场下实现磁矩翻转的问题,本论文针对该问题研究了Co/Pt/Ta/Co Fe B/Mg O多层膜的电流驱动无磁场磁矩翻转及效率。通过Ta与Co/Pt和Co Fe
入侵检测技术是网络安全领域的一项关键技术。机器学习的兴起给入侵检测带来了新的选择,通过建立专门的分类预测模型可以实现对威胁的精准预测。但是在建立模型的过程中,高维度的入侵检测数据中冗余的特征会对模型的准确率带来较大的影响;单一的模型也不能应对当前环境下复杂的入侵检测情况;且没有供研究使用的实际平台。针对上述问题,提出一种基于混合特征选择和stacking集成模型的入侵检测系统。本文的研究成果归纳如
癌症具有早期诊断困难、晚期难以治愈的特点。因此,迫切需要发展高灵敏检测技术实现对癌症的早期筛查。ct DNA作为一种非侵袭型、“实时”的癌症评估生物标志物,在癌症早期诊断中具有重要意义。现有的ct DNA的检测技术,存在重复性差、生物功能化手段复杂、目标物的检测灵敏度不足等问题。二维纳米材料具有大的比表面积和易于功能化等优点,不仅能够扩大传感界面的比表面积,而且可以提高传感界面的性能。少层二维纳米
近年来芯片制造工艺不断演进,相应的芯片制造成本也在不断提高,因而需要在芯片制造前对其进行充分的验证,确保芯片设计的可靠性。而卷积神经网络加速器芯片设计高度复杂且处理数据规模庞大的特性,对芯片验证工作提出了更高的要求,需要采用更加先进的验证方法学开展工作。由于UVM验证方法学标准化的结构和可移植性强的特点,本文基于UVM验证方法学开展针对卷积神经网络加速器芯片的验证技术研究,提出一种面向卷积神经网络
随着分布式可再生能源的渗透率不断提高,用户侧可再生能源,如屋顶光伏、园区光伏和风电等,与传统负荷融合,形成新型的有源负荷,本文称之为广义负荷。其特性与传统负荷截然不同,随机性和波动性更强,需要建立新型的广义负荷模型和预测方法。广义负荷对输配电网的安全运行和优化调度带来新的挑战。对此,本文分别从三个方面展开研究:(1)广义负荷特性分析与模型;(2)广义负荷预测;(3)计及广义负荷的输配电网分布式协调