基于深度学习与历史交互序列建模的推荐排序算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:mllx03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网技术高速发展的时代背景下,人们在享受获取丰富资源的便捷性的同时,也面临着信息过载的问题。推荐系统的诞生为人们从海量数据中筛选出感兴趣的信息提供了新的可能性,因此,近年来推荐系统在电子商务、在线广告系统、社交媒体等领域的实际应用中扮演着越来越重要的角色。在实践中,完整的推荐系统通常包括候选集生成阶段和排序阶段,本文主要关注排序阶段的算法研究工作。推荐排序算法的关键在于如何有效利用丰富的特征及其复杂的关系,实现精确预测用户对物品偏好的目的。为了实现推荐的个性化,近年来研究者纷纷基于注意力机制等技术设计更加精细化的推荐排序模型加强对历史交互信息的利用。然而,在实际推荐场景中广泛存在物品长尾问题。由于交互信息不充分,针对长尾物品的推荐比针对高曝光度物品的推荐更加困难。此外,新用户与新物品不断出现,如何在缺少历史交互信息的情况下进行推荐成为比长尾物品推荐问题更加困难的挑战,逐渐形成了面向冷启动问题的推荐这一研究方向。本文以历史交互序列信息为着手点,研究如何更好地利用历史交互序列信息提升推荐排序模型的预测性能,以及在历史交互序列信息不足的情况下,如何设计算法充分利用仅有的信息快速生成高质量的替代特征。在此基础上,本文提出了两个基于深度学习的推荐算法针对性地解决上述问题,并将其应用在实际的图书推荐系统中。本文的主要研究内容与贡献如下:首先,本文从历史交互信息的有效利用角度出发,将用户与物品的交互建模为一个动态二部图,在此基础上提出一个多向交互图注意力网络推荐模型,简称MIGAT。MIGAT模型基于注意力机制分别考察历史交互序列中的每一项交互对其交互对象、推荐对象以及推荐上下文的重要度,同时考虑到交互发生时间的早晚对交互置信度的影响,设计置信度嵌入向量结构以区分不同交互的置信度。综合多个维度下的重要度衡量指标,MIGAT模型基于图神经网络与前馈神经网络结构生成表达能力更丰富的用户特征表示、物品特征表示以及自适应的交互序列特征表示。经实验验证,该模型在多个数据集上表现优于当前先进的推荐排序模型,在长尾问题比较严重的情况下性能提升更加明显。其次,本文针对新用户或新物品缺少历史交互信息的问题,提出一个基于元学习的伪交互序列生成器模型,简称Me PIGen。该模型基于元学习算法对参数进行学习,使得模型经过少量几次对新用户与新物品的探索之后就能生成高质量的伪交互序列特征。伪交互序列特征将作为真实交互序列的替代特征用于推荐排序模型中,以提升推荐排序模型的预测性能。Me PIGen的结构基于Transformer而设计,将现有的历史交互序列与属性特征作为输入,得到输出的伪交互序列,保证生成伪交互序列的质量与效率。经实验验证,该模型在多个数据集上使得当前先进的推荐排序模型的冷启动推荐性能得到提升。最后,本文所提出的两个推荐模型应用于实际搭建的图书推荐系统中,获得良好的推荐性能。该图书推荐系统中,从针对新用户的冷启动阶段,到已经积累一定交互数据样本进入常规阶段,构成一个完整的推荐体系,充分展示了模型的实际应用价值。
其他文献
在科技日益发达的今天,经济全球化随着网络技术的更新迭代席卷而来,同时,挑战也随之出现,企业能否转型升级以应对更为激烈的竞争,成为企业战略中不可或缺的议题。为增加管理模式的综合效益,企业集团开始选择创新管理模式,采用财务共享服务的新型模式,将非核心业务从分散的组织机构中进行剥离整合统一到专门机构,高效率地规整统一有限资源的最优配置,使企业运营成本逐步下降,经营效率得到提高,防控风险能力进一步增强,企
寨上-马坞矿集区位于西秦岭多金属成矿带,有寨上金矿、马坞金矿、锁龙金矿、新庄里金矿、雪花山钨矿、半沟铅锌矿等矿床产出。前人对寨上-马坞矿集区的地质特征,成矿规律,成矿模式,物化探特征,矿床成因等方面开展了大量深入研究,然而,传统找矿预测方法进展有所减缓,急需一种新方法为该地区找矿预测工作带来新进展以及新思路。人工智能以及NLP(Natural Language Processing)技术在该区域的
学位
学位
学位
中国近代工业建筑是“现代建筑技术的先导”,作为近代时期萌生的“新建筑类型”,不论是建筑历史、结构还是风格都颇具研究意义。刘先觉教授认为“中国近代建筑史应该反映中国新兴工业建筑从无到有发展的历史”,提倡给近代工业建筑一定的地位。自其产生以来,近代工业建筑相关的研究记录众多,但是一直没有关于此类研究的梳理。中国近代工业建筑的研究大致经历了三代建筑学研究者不同程度地推动:第一代研究者中,以梁思成和徐敬直
有机发光二极管(Organic Light-Emitting Diode,OLED)由于其轻薄、宽视角、响应快、亮度高以及可弯曲的优势为照明和显示技术提供了一种新型高效且可持续的方法,并且正在取代市场上的部分技术,例如液晶显示(Liquid Crystal Display,LCD)。OLED有着广泛的商业、医疗以及工业应用。除此之外,OLED在未来可穿戴设备应用中也具有极大的潜力。目前,许多研究都
在土壤的形成过程中,我们通常假设一个自上而下的发育模式,即土壤是由其下基岩风化而形成的。这个模式并没有考虑到风尘对土壤的贡献,而该贡献却是不可忽视的。延伸达上千公里的中国黄土沉积区域反映了风尘对土壤形成的巨大贡献,但在更多非典型风尘沉积带的土壤,风尘贡献研究却严重不足。由于风尘的矿物和化学组成上与上部大陆地壳平均成分有较高的相似性,这让我们对一般土壤中的风尘识别变得困难。玄武岩与风尘在矿物与化学组
小样本学习是机器学习的一个重要研究方向,聚焦于解决实际应用场景中常见的样本数量短缺的问题。近年来,飞速发展的神经网络为小样本学习各任务的研究带来了新的思路:在计算机视觉领域,目前小样本学习的研究主要聚集在解决小样本图像分类问题上。在这个问题上,学者们依照不同的思路对问题提出了各式各样的解决方案,包括基于扩充数据的、基于模型结构设计的、基于不同形式的推理过程的方法。但是,这些方法大多需要对单个图像以