论文部分内容阅读
在互联网技术高速发展的时代背景下,人们在享受获取丰富资源的便捷性的同时,也面临着信息过载的问题。推荐系统的诞生为人们从海量数据中筛选出感兴趣的信息提供了新的可能性,因此,近年来推荐系统在电子商务、在线广告系统、社交媒体等领域的实际应用中扮演着越来越重要的角色。在实践中,完整的推荐系统通常包括候选集生成阶段和排序阶段,本文主要关注排序阶段的算法研究工作。推荐排序算法的关键在于如何有效利用丰富的特征及其复杂的关系,实现精确预测用户对物品偏好的目的。为了实现推荐的个性化,近年来研究者纷纷基于注意力机制等技术设计更加精细化的推荐排序模型加强对历史交互信息的利用。然而,在实际推荐场景中广泛存在物品长尾问题。由于交互信息不充分,针对长尾物品的推荐比针对高曝光度物品的推荐更加困难。此外,新用户与新物品不断出现,如何在缺少历史交互信息的情况下进行推荐成为比长尾物品推荐问题更加困难的挑战,逐渐形成了面向冷启动问题的推荐这一研究方向。本文以历史交互序列信息为着手点,研究如何更好地利用历史交互序列信息提升推荐排序模型的预测性能,以及在历史交互序列信息不足的情况下,如何设计算法充分利用仅有的信息快速生成高质量的替代特征。在此基础上,本文提出了两个基于深度学习的推荐算法针对性地解决上述问题,并将其应用在实际的图书推荐系统中。本文的主要研究内容与贡献如下:首先,本文从历史交互信息的有效利用角度出发,将用户与物品的交互建模为一个动态二部图,在此基础上提出一个多向交互图注意力网络推荐模型,简称MIGAT。MIGAT模型基于注意力机制分别考察历史交互序列中的每一项交互对其交互对象、推荐对象以及推荐上下文的重要度,同时考虑到交互发生时间的早晚对交互置信度的影响,设计置信度嵌入向量结构以区分不同交互的置信度。综合多个维度下的重要度衡量指标,MIGAT模型基于图神经网络与前馈神经网络结构生成表达能力更丰富的用户特征表示、物品特征表示以及自适应的交互序列特征表示。经实验验证,该模型在多个数据集上表现优于当前先进的推荐排序模型,在长尾问题比较严重的情况下性能提升更加明显。其次,本文针对新用户或新物品缺少历史交互信息的问题,提出一个基于元学习的伪交互序列生成器模型,简称Me PIGen。该模型基于元学习算法对参数进行学习,使得模型经过少量几次对新用户与新物品的探索之后就能生成高质量的伪交互序列特征。伪交互序列特征将作为真实交互序列的替代特征用于推荐排序模型中,以提升推荐排序模型的预测性能。Me PIGen的结构基于Transformer而设计,将现有的历史交互序列与属性特征作为输入,得到输出的伪交互序列,保证生成伪交互序列的质量与效率。经实验验证,该模型在多个数据集上使得当前先进的推荐排序模型的冷启动推荐性能得到提升。最后,本文所提出的两个推荐模型应用于实际搭建的图书推荐系统中,获得良好的推荐性能。该图书推荐系统中,从针对新用户的冷启动阶段,到已经积累一定交互数据样本进入常规阶段,构成一个完整的推荐体系,充分展示了模型的实际应用价值。