一种基于图高阶结构和图自编码器的有向图链路预测方法

来源 :南京财经大学 | 被引量 : 0次 | 上传用户:zhengi520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
链路预测是复杂网络中的一项重要研究内容,它的目的是根据现有的节点链接情况和节点属性预测出图中潜在的或者将来可能产生的链接。网络也称为图,由于图的种类不同,图包含的信息有所不同,这也导致需要使用不同的链路预测方法。在无向图中,现今多数方法都是基于网络表示学习(Network representation learning)的方法。它们首先通过现有的节点的链接情况(只关注节点间是否有链接)以及节点属性得到每一个节点的低维表示向量,然后根据表示向量间的相似性预测节点间的链接情况,即越相似的节点之间产生链接的概率越大。而有向网络作为现实生活中更为常见的网络类型,却缺乏有效的链路预测方法。这是因为在有向图研究中,还需关注节点间链接的方向性。而大部分现有的有向图链路预测方法则忽略有向图的方向性,将其作为无向图来处理,这显然不是一种足够有效的有向图链路预测方法。在有向图链路预测研究中,如何有效的保留且利用链接情况(关注节点间是否有链接和链接的方向)和节点属性获得低维表示向量以及如何预测链接的方向性是两个关键难点。为了解决表示学习过程中如何考虑链接方向的问题,本文通过对网络高阶结构和图编码器进行分析,提出了基于网络高阶结构和图卷积神经网络的有向图编码器。网络高阶结构是为了区别于低阶结构(网络中的节点和边)提出的概念,它表示网络中大于等于3个节点组成的子结构。本文首先通过对于网络中高阶结构进行统计,构造高阶邻接矩阵。在邻接矩阵中,其中的非0值表示对应两个节点间存在链接,而在高阶邻接矩阵中,非0值则表示两个节点共同存在于某个高阶结构中。通过构造高阶邻接矩阵,不仅能够得到适用于后续图卷积过程的对称矩阵,还保留网络中的邻接信息,尤其是其中的链接方向。最后本文通过图卷积神经网络进行训练,以获得每个节点在低维表示空间内的低维表征向量。而图卷积的规则就是高阶邻接矩阵,即每个节点会聚合与它参与了对应高阶结构的节点的信息。通过这样一个针对有向图的编码器,本文完成了对于有向图的数据挖掘,获得了每个节点的低维表征向量。而在解码器的过程中,有向图区别于无向图的点在于有向图不仅需要预测链接的概率,还需要预测链接的方向性。为了解决这一问题,本文提出了一种结合节点中心性的解码器,该解码器主要遵循两个原则:1.两个节点的表征向量距离越小(即两个节点越相似),它们之间的链接概率越大;2.链接总是倾向于指向中心性大的节点,即目标节点的中心性越大,链接的概率也会越大。通过对于节点中心性进行研究,本文选取了Page Rank中心性作为节点中心性的评价指标,提出了一种基于引力启发式的解码器。增强了整个解码器的可解释性。本文将编码器与解码器进行结合,提出了一种基于图自编码器的有向图链路预测模型(MGAE),为了进一步提升本文的链路预测效果,本文还提出了基于变分自编码器的链路预测模型(MVGAE)。最后,本文在四个真实数据集上进行了链路预测实验,并且通过四种不同评价指标与4种对比方法进行比较,结果表明本文提出的MGAE以及MVGAE更加有效,并且为了探讨其背后的原因,为后续研究提供思路,本文还对于其中的每个模块以及重要的参数进行了分析。
其他文献
集成学习作为一种机器学习框架,以综合多个学习器的方式获取比单一学习器更加优越的泛化性能,聚类集成是以集成学习的思想通过组合多个基聚类器以提高聚类的准确性、稳定性和鲁棒性。而以分布式存储的大规模数据分析为目标的分布式聚类其本质上正是属于一类基于异构数据选择的聚类集成,可被称为中心化聚类集成。本文首先在聚类集成算法理论的基础上,针对一致性函数中忽视基聚类结果间差异性的问题,结合粒计算和信息熵的思想,研
学位
说话人确认是声纹识别的子任务之一,其目标为辨识两段语音的说话者是否相同。随着深度学习的发展,说话人确认的识别精度得到了显著提升,但在录音设备距说话者较远时,混响和噪声会极大遏制模型的性能,尤其是在小样本情况下,匮乏的数据难以支撑起模型对语音距离的理解,性能下降问题也就越发突出。对于如何提高远距离识别的鲁棒性,本文在卷积网络的基础上对模型结构和训练方式进行优化,其主要研究内容如下:(1)针对远距离下
学位
随着先进电子设备的集成化和小型化,高效热管理系统需求日益迫切。热管理材料是热管理系统的重要组成部分,它能够实现热能的传输、存储和转换。然而传统的热管理材料无法跟随现代科学技术发展的步伐。因此,研发先进的热管理材料十分必要。热管理材料仅仅具备热管理能力会限制其应用前景,为进一步提高热管理材料的应用价值,开发多功能性热管理材料具有重要意义。本论文的研究内容包括如下三个部分:(1)通过真空辅助过滤的方法
学位
ZnO压敏电阻器具有非线性高、响应速度快、通流能力强等优点,在电路中可以起到过电压保护、吸收瞬间电压浪涌等作用。目前在叠层片式压敏电阻器的制备过程中,因为贱金属容易被氧化而难以与ZnO压敏陶瓷实现共烧,而采用价格昂贵的贵金属Pt或Ag/Pd合金内电极。因此,降低烧结温度,实现ZnO压敏陶瓷与电极共同烧结成为一个研究热点。本文将添加预合成粉体并采用真空烧结再氧化处理方式制备出性能较好、烧结温度较低的
学位
在人类历史的展长河中,随着朝代的更替、社会经济的迅猛发张,促进了人类的进步,也促进了中国坐具的发展。坐具的发展使人们从"席地而坐"逐渐发展到"垂足而坐"。此时,人们也慢慢的对自己生活中所使用的坐具有了更多的要求,其中宋朝太师椅影响最大,不仅仅是它的实用性功能,其中还有包含了它的舒适性和美观性,进而人们对中国坐具的设计创新有了更大的追求,同时,对现在也产生了很大的影响。
期刊
当前,人工智能发展迅速,但是人工智能如何实现因果推理一直备受关注,线性规划理论是人工智能的基础优化理论,对线性规划的突破和创新即是对人工智能理论的创新。线性规划是否存在强多项式算法是跨世纪的国际数学难题,该问题的突破将为人工智能的发展化解一个重大的理论难点。为了给这一问题的突破提供思路,本文基于棱锥切割理论阐述并完善了三种求解技巧:(1)、拔高加速方法;(2)、在单纯形法的特定情况下比传统列消去定
学位
桩基础作为建筑项目土建工程中的重要组成部分,其施工水平对于项目整体质量产生着重要影响。文章基于桩基础施工原理以及基本流程,以复旦大学江湾校区学生宿舍(一期)项目为例,详细分析PHC预应力混凝土管桩、高压旋喷桩施工技术要点,以期提高桩基础施工水平,为建筑项目土建施工的顺利进行提供技术支持。
期刊
农作物病害是影响作物产量和质量的主要危害之一,及时准确的识别农作物病害种类是防治农作物病害的关键。在传统的病害图像识别方法中,主要依靠手工提取特征,这种方法一般都需要复杂的特征工程,因此费时费力,而且模型的鲁棒性一般较差。近年来,随着深度学习技术的发展,尤其是深度卷积神经网络在数据驱动下可以自动的提取特征,实现端到端的识别,省时省力,使得基于深度学习的农作物病害的检测和诊断,成为计算机视觉研究领域
学位
随着城市监控相机的普及,监控视频在人类生活中发挥着越来越重要的作用,但越来越多的摄像机增加了监控人员的图像内容认知压力。为提升监控人员对视频内容空间化、广域化、智能化认知的能力,需要将视频图像与相机、相机视域的地理空间位置相关联,实现海量监控视频与地理环境的融合表达。当前,已发展出诸多视频-地理场景融合表达方法,但对这些方法表达效能的优劣缺乏比较,亟需进行相关研究分析。据此,本文主要从以下三个方面
学位
针对高层建筑中的土建施工技术进行探究,结合高层住宅建筑的实际情况,分别从桩基础、基坑开挖支护、混凝土浇筑三个方面详细阐述了施工技术方法。研究表明:土建施工是高层建筑施工的重要组成部分,根据建筑特点和现场环境条件,科学设计施工方案,优化工艺流程,采取必要的质控措施,才能实现预期施工管理目标。
期刊