利用特征交叉与图结构的推荐算法研究及应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:zeone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统通过对互联网应用中的用户、物品、上下文信息等对象进行建模,自动为用户推荐其可能感兴趣的物品,可缓解互联网时代的信息过载问题。由于推荐算法的输入特征是由多个对象的one-hot或multi-hot编码组成的,特征稀疏且维度高,因而进行特征交叉对于捕捉有用信息十分有效。同时,这些对象亦可用异构图进行表示,例如用户和物品之间的二分图、物品之间的关系图等,图结构可直观地体现对象之间的联系。本文围绕推荐系统中对象的这两种表示方法展开,充分利用特征交叉和图结构提升推荐算法的性能,具体成果如下:
  1. 因子分解机(Factorization Machine,FM)将二阶特征交叉项的系数表示成特征对应的欧氏空间嵌入向量的内积,考虑到对象组成的异构网络具有层次结构和幂律分布的特性,而平坦的欧氏空间无法刻画这种特性,限制了 FM 的特征表示能力,为此提出了双曲因子分解机(Hyperbolic FM,HFM)。它将每维特征表示为双曲空间而非欧氏空间中的向量,并利用双曲距离度量评估特征间的交互强度。选择双曲空间是因为其被证明更适合树、图和词汇等具有层次结构的对象嵌入。本文分别设计了基于庞加莱球和基于双曲面两种双曲空间模型的HFM,并导出了对应的黎曼梯度下降优化算法。在多个数据集上的实验结果表明,HFM在等量参数的情形下,获得了比FM更优的性能,同时揭示出了在FM中欠缺的特征间的层次关系,使之具有部分可解释性。
  2. FM及利用深度神经网络构建特征交叉的模型通常孤立地对待每个用户-物品交互样本,无法显式地利用样本中对象之间的隐含关系,导致学到的特征嵌入未必是最优的,样本孤立带来的信息孤岛问题导致冷门或冷启动物品无法获得精准的推荐,因此,提出结合图表示学习和特征交叉的图卷积交叉网络(Graph Convolutional Cross Network,GraphCross)。GraphCross分为两个部分:图卷积部分利用不同训练样本中对象的关联性构建异构图,并在此基础之上进行图卷积运算,使得生成的对象嵌入囊括其紧密相关的邻域节点对象的信息,破除样本之间的孤立性;特征交叉部分是一个FM模型,利用图卷积网络生成的对象嵌入捕捉有意义的特征交叉。GraphCross亦可推广为基于图表示学习-特征交叉的推荐算法框架。实验结果表明,利用图结构可有效提升推荐系统性能,尤其是针对冷门物品的推荐。
其他文献
随着互联网规模的日益扩大,传统网络架构的局限性无法很好地满足多元化新业务所带来的通信需求。因此,如何设计新型网络架构,以从根本上解决传统网络的弊端,已成为信息领域最为迫切的研究内容之一。智慧标识网络通过灵活化的连接调度实现对网络的智慧化协同管控,是一种具备良好发展前景的新型网络架构。而由于互联网具有强大的开放性,攻击者仍然能在分析新型网络架构特征的基础上探寻新型攻击方式,网络中的安全隐患仍然存在。
随着数字媒体的不断发展,视频技术已经越来越多的应用于各个领域。但是,由于视频本身携带的数据量很大,直接应用不够现实,因此,需要在传输之前对其进行压缩。为了适应视频高分辨率的要求,视频编码技术经过了一系列发展,比如从H.264(Advanced Video Coding)到HEVC(High Efficiency Video Coding)等。针对这些编码标准的高复杂度问题,目前也有相关优化算法被提
学位
近年来,伴随着智能技术的发展,智能化的移动机器逐渐走进人们的视野,定位技术作为移动机器人的重要技术之一,一直是人们关注的热点。目前最常用的定位系统为GPS和惯导,GPS可以实现在各种气候条件下、持续精密的导航,但受外界影响比较大,在有电磁干扰或者有遮挡的情况下不可用,惯导系统虽不受外界干扰,但会随时间的积累产生累积误差,定位的精度会受到影响。现今随着机器视觉技术的不断发展,基于视觉的定位方法,尤其
学位
随着计算、通信和传感器技术的快速发展,大量的复杂动态系统比如自动制造系统,智能交通系统和物流系统等应运而生,它们都具有混合命令、控制、通信和信息问题的特征。由于各种信号的并发和冲突以及人为设计的运行规则,系统状态只能通过随时间异步发生的离散事件来改变。因此,这类人造系统通常被视为离散事件系统。特别地,由Ramadge和Wonham共同提出的监督控制理论为离散事件系统的控制提供了有力的支撑,其特点在
随着图像领域的飞速发展,导航系统中也渐渐开始使用计算机视觉技术。在GNSS(全球卫星导航系统)拒止条件下,面向无人机安全自主着降的任务需求,设计了一种新型合作标志,研究了目标的特征提取与跟踪方法,研究了无人机视觉导航位姿解算方法,研究了固定翼无人机着降视觉导航技术和固定翼无人机的回收技术等视觉导航应用,提出了一种使用视觉导航来修正无人机基于惯导推算的位姿累积误差的方法,最终实现了无人机的安全自主着
学位
近年来,卷积神经网络在计算机视觉领域取得了巨大成功,其在不断提高图像分类、目标检测和图像语义分割等任务精度上限的同时,模型尺寸与运行时间也在急剧增加。由于移动端设备存在存储空间和计算能力的约束,使得现有卷积神经网络无法在这些资源受限设备上进行很好的部署和应用。在这种情况下,研究人员通过设计高效的卷积结构来代替传统网络中的标准卷积层,以达到减小模型参数量和运算量的目的,但是此类方法仍然存在模型泛化能
深度学习已经得到飞速发展,在图像识别领域,卷积神经网络的鲁棒性保证显得尤其重要。由于卷积神经网络的分布式表示特点,会对输入图像产生众多特征表示,这些特征表示中存在大量噪声信息,会严重影响网络的性能,此外由于训练数据的局限性,会影响神经网络区分非正常输入的能力。为了提高卷积神经网络的鲁棒性,我们在噪声通道选择、噪声特征过滤和防御对抗攻击三个方面分别提出了三个方法。针对噪声通道的存在而影响神经网络鲁棒
学位
随着RNA-seq产生的读段数量日益增加,读段比对成为了一个非常耗时的任务和环节。在RNA-seq分析中,准确而又有效的读段比对一直是一个难点和挑战。许多比对算法在可容忍的时间范围内采用不同的策略来为读段寻找可能的比对位置,并且为下游分析提供大量的比对信息。但是一些转录本分析任务(如转录本定量分析)只需要得知读段在转录本上的位置即可。由于转录本不含有内含子,读段可以被连续地比对到参考转录本,而不需
学位
传统的图像去模糊算法是通过估计模糊核的方式进行图像的盲去模糊,运行速度较慢,实际应用价值不大。受到近年来提出的图像到图像风格转换任务的启发,我们注意到图像的盲去模糊可以视为图像到图像的风格转换问题。所以本文着重于研究如何将生成对抗网络应用于图像的盲去模糊,同时还有研究如何在保证神经网络的去模糊质量的情况下,压缩模型大小和减少参数量。本文提出的减少生成对抗网络模型参数量的方法有两种思路,一种是设计用
监督学习通常需要大量标记样本训练模型。然而,在许多真实场景下,我们只有少量的已标记样本,以及大量的未标记样本,且标记的获取往往需要耗费大量的人力物力。主动学习通过有选择性地向专家查询对模型提升最有帮助的样本以减轻数据标注的代价,目的在于以尽可能少的代价获得性能尽可能高的模型。目前大多数现有的主动学习研究主要集中在样本选择策略上,尽管它们能够显著降低数据标注量,但数据采集的整体成本仍然较高,这其中有
学位