异构社交网络中基于元路径的链接预测研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:aaa110122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构社交网络是一种包含不同类型的节点和边的社交网络,它不同于传统的同构社交网络的地方在于它包含着许多的语义信息。异构社交网络上的链接预测是指根据异构社交网络所提供的拓扑信息和语义信息来预测两个节点之间形成边的可能性。元路径是一个以节点为端点、节点和边交替出现的序列,它是异构社交网络中常用的拓扑信息和语义信息提取工具。因此,本文的研究重点是探究如何更加高效地使用元路径来提取和利用异构社交网络中的拓扑信息和语义信息,然后将它们用于链接的预测。近几年的研究提出了许多基于元路径对异构社交网络进行链接预测的方法,虽然它们利用了异构社交网络中的拓扑信息和语义信息,并在链接预测任务上都取得了较好的性能表现,但是它们仍旧存在着一些不足之处,这些不足之处导致它们的性能表现仍有待进一步提高。例如,它们仅使用单条元路径而导致了其对异构社交网络中语义信息的利用不够充分。同时,这些方法都聚焦于在节点层面利用元路径提取特征,而没有在边的层面利用元路径提取特征,这使得它们所提取的特征无法很好地适用于链接预测这一与边紧密相关的任务。另外,这些方法都仅考虑对单个社交网络内部信息的利用,这使得它们无法在稀疏网络中取得很好的性能表现。为了解决现有工作中存在的不足并提高异构社交网络中链接预测的性能,本文的主要工作有:1)针对现有方法仅利用单条元路径而导致对异构社交网络的拓扑信息和语义信息利用不充分的问题,本文提出一种基于语义子图和图注意力机制的解决方法。该方法分别基于不同的元路径来构造不同的语义子图以提取异构社交网络中不同的拓扑信息和语义信息。该方法还利用子图内注意力机制来学习语义子图中不同节点的权重,并使用语义子图间注意力机制来学习不同语义子图的权重。2)针对现有方法只在节点层面利用元路径来提取特征而导致这些特征无法很好地适用于链接预测任务的问题,本文的解决方法使用一种基于元路径的语义流通量概念以从边的层面利用元路径提取特征。该方法通过计算语义流通量获取与边紧密相关的特征,并基于不同的元路径计算与不同语义相关的特征。3)针对许多现有研究仅利用单个网络内部的拓扑信息和语义信息导致无法解决网络稀疏性的问题,本文提出基于跨网络元路径的解决方法。该方法利用基于锚链接的跨网络元路径从源网络中传递信息到目标网络以弥补目标网络中信息不足的问题,它通过这些额外的辅助信息提高链接预测的性能。同时它还利用信息增益比对基于元路径提取的特征进行选择,以避免误导信息的使用而影响链接预测的性能,此外它还使用一种基于AUC(Area Under ROC Curve)优化的方法来解决链接预测的PU学习问题(Positive and Unlabled instance learning problem)。
其他文献
近年来,计算机图形学得到了迅速的发展,在科学研究、工业设计以及日常生活娱乐中的应用层出不穷,扮演了越来越重要的角色。在计算机图形学中,计算曲面的参数化映射是一个基本的问题,在曲面的表示和处理上有着非常重要的地位。一般来说,参数化映射需要满足无翻转和低扭曲的条件。为了满足各种不同应用的需求,一些特殊的参数化映射得以产生。本文将研究一类特殊的参数化映射——轴对齐参数化映射,其参数化区域具有边界对齐坐标
非均匀有理B样条(NURBS)和细分是两种主要的自由曲面表示方法。NURBS是工业的标准,细分是动画的标准表示。为了将NURBS推广到任意拓扑,引入了非均匀细分。本文主要研究了非均匀细分,包括以下三个方面的内容。第一部分,我们通过特征多边形构造了一个新的非均匀Doo-Sabin细分格式,证明了在一个较小的假设下(当λ是细分矩阵的第二和第三特征值),对于任意价奇异面和任意给定的正的节点距,极限曲面总
本文研究了超奇异同源图以及同余方程λ1x1k1+…+λtxtkt≡c mod n解的计数两个问题.第一章,我们首先简单回顾了超奇异同源图的研究背景以及已知的研究成果,并且介绍了我们在同源图中Fp点处得到的结果.其次我们回顾了同余方程解的计数问题,并且介绍我们的主要定理.第二章,我们回顾了代数数论,椭圆曲线和复乘,以及Deuring对应的基本理论.第三章,我们介绍了超奇异椭圆曲线同源图的定义gl(F
随着网络技术的不断发展与进步,光通信系统需要更高的通信带宽与速率,这些新的挑战给光通信领域带来新的发展机会。可调谐激光器在光通信、传感等领域有着重要的作用。而光通信系统面临光信号处理与分析的新挑战,对激光器的线宽也提出了新的要求。可调谐窄线宽激光器也是高速相干光通信系统中的核心光电子器件。本论文基于重构等效啁啾技术设计并制作了双段式HR-AR镀膜激光器及其阵列,并研究了一种压窄可调谐激光器线宽的新
燃料电池被认为是21世纪以来最有前景的新能源技术之一。然而,燃料电池阴极的氧还原反应过程非常迟缓,高度依赖Pt贵金属催化剂,而由于Pt贵金属储量不明且年产量较低,这严重阻碍了燃料电池的大规模商业化应用。如今Pt-M合金体系成为燃料电池催化剂研究的热点,Pt-M合金体系不仅能有效降低电极Pt载量使燃料电池的成本显著下降,同时合金的形成调整了Pt的d带中心,优化氧还原过程中催化剂与氧的结合能,从而带来
激光雷达相对于传统电磁波雷达,具有测量范围广、测量精度高、抗干扰能力强、体积小等优点,在现代社会中实现了广泛应用,大量应用于军用和民用领域。低成本、高精度、小体积、可集成是激光雷达目前的主要发展方向,半导体激光器具有工作稳定性好、体积小、波长范围广、工作寿命长、可直接调制等优点,成为了激光雷达系统的理想光源。双频半导体激光器作为激光雷达测速和测距的光源,具有测量精度高、抗干扰、便于集成等优点,应用
多标签文本分类是指一个文本实例可以同时关联一组标签集合而非单个标签。随着数据的爆炸性增长,基于深度学习的多标签文本分类已经成为该领域的一个研究热点。深度学习中的注意力机制广泛应用于多标签文本分类中,并为所有的标签学习出唯一的特征表示。由于不同的标签蕴含不同的语义信息,文本中的同一单词应当被不同标签赋予不同的关注度,然而传统的注意力机制未能考虑这一问题。随着标签数目的增加,利用标签关系可以有效缩小标
在这个万物互联的时代,车辆成为第三大联网设备,车联网技术受到学术界和工业界广泛关注。车联网以信息通信技术为核心,集成了通信、传感、定位等多项前沿技术,能显著提高行车安全和效率。由于用户需求的多样性,车联网中存在多种不同制式的网络。另一方面,由于车辆用户节点具有移动速度高、随机性强的特点,会导致在不同网络间产生大量切换,从而降低用户的通信质量。因此,如何在保证车辆用户服务质量的前提下,减少不必要切换
目前机器学习在数据分析领域有广泛应用。特别是在医疗领域,机器学习算法可以辅助医生进行诊疗,既提高了效率又充分发挥出了医学大数据的价值。例如,在乳腺癌临床诊断数据分析中就常用到机器学习算法中的聚类算法和分类算法。同时,随着医学数据规模与日剧增,机器学习算法应用愈加广泛,云计算技术将有效助力于大数据的存储与计算。然而云服务器一般被认为是不完全可信任的,将医疗数据外包至云进行存储与计算具有隐私泄露风险,
不孕不育是当今世界面临的最为重要和最紧迫的问题之一,影响了全球10-15%的育龄夫妇。其中,近一半的不育症与男性因素有关;而在男性不育的发病中,多种遗传因素涉及其中。本论文旨在鉴定和研究新的导致男性不育的基因突变和染色体异常,并确定Exo5基因在小鼠精子发生中的作用。第1部分:我们招募了一个原发性不育的巴基斯坦近亲家系,该家系具有三位不育的男性患者。精液分析显示不育患者表现为轻度至重度少精症,而且