Semi-supervised Node Classification Based on Graph Markov Convolution Neural Network

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:myloft2w
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类生活的世界是相互连接的,实体可以被视为具有不同属性的网络结构上的节点,不同的实体之间根据属性的差异又各自具备不同的相互关系。对于实体之间依据属性区分进行关系建立的操作被成为关系数据建模。近年来,关系数据建模主要跟从图深度学习和统计关系学习两个领域。图神经网络能够利用数据的属性和结构,通过非线性的神经网络内层,对目标进行端到端的训练和输出,统计关系学习方法可以建立标签之间的依耐性,可以使得这种学习预测的效果更加强大。而这种通过查看其邻居的标签来确定样本的标记(表示为节点标签)的任务,称之为节点分类。图神经网络的概念来自于图。在最近的一段时间,图被视作信息的最佳表示方式。在一个图中,有通过边连接起来的节点。具备图输入结构的图神经网络对节点分类任务具有天然的优势。例如,在社交网络中,以用户为中心连接上用户朋友们,用户的朋友又以不同的方式相互联系。在图中这些关系并不是规则排列的,而是具备一些随意性。即该用户的朋友间可能彼此存在朋友关系,也可能不存在这种关系。通过图结构表示社交网络中用户的相互关系,可以通过利用包含在图结构中相邻节点的信息来预测和确社交网络用户的相关属性和偏好,例如社交网络用户想知道他的朋友们是篮球爱好者或者是足球爱好者,可以在对社交网络上应用关系数据建模的方法,将学习归类的”体育爱好”这个节点属性分配给缺少标签的节点。然后通过输入用户的其他属性,来对缺少标签的节点的标签进行学习和分类。相较之下,传统的神经网络不会利用实体之间的关系来预测,它们只能提取个体属性,缺少有效信息的提取。对于节点分类任务,图神经网络的工作和统计关系学习的工作具有差异,具体表现在:图神经网络(GNNs)属于深度学习体系结构,是一种连接主义的模型,它可以通过图节点之间的消息传递来获得图的依赖,GNNs可以独立的在每个节点上传播。因此,GNNs的输出不随节点的输入顺序变化。此外,图中的边表示两个节点之间的依赖关系。在传统的神经网络中,这种依赖关系只能通过节点的特征表示来体现。GNNs可以依赖周围的状态来更新节点的状态,因此具有强大的特征表征能力。除此之外,GNNs能够从非结构化数据中生成图的特点。但与传统的神经网络类似,GNNs独立的对节点标签进行预测,忽略了标签之间的依赖关系,从而在分类过程中丧失部分节点的标签相关性,影响分类成功率。与此相对的是,在统计关系学习中(SRL),通常利用条件随机场(CRF)对节点的标签依赖关系进行建模,该模型能够学习到节点标签之间的联合分布。但是,该方法需要手工定义特征函数进行一系列的线性组合来组成势函数,通常这些特征函数都是启发式的,也就是特征需要人工定义,表达能力有限。此外,网络中的节点关系结构非常复杂,计算节点标签之间的后验分布十分困难。在实际的节点分类的工作中,通常以节点的属性特征为重心,将特征向量送入分类器做训练。同时,相邻节点的类别趋近和标签之间的关系对于节点分类的结果具有显著影响,因此在进行节点分类时要考虑节点的同质性和标签之间的依赖关系。本文回溯了最近几年节点分类任务研究领域的研究成果,总结和评价了不同方法模型的优缺点,并跟从该研究领域的最新方法图马尔可夫神经网络(GMNN)的相关工作,提出了一种改良模型(GMCN),该模型借鉴了图卷积神经网络利用图卷积操作提取特征信息的方法,并最终达到提高节点分类的准确率的目的。具体表现在:结合了图深度学习强大的节点特征信息提取能力和统计关系学习方法中马尔可夫随机场建立标签依赖性的能力,利用图卷积操作提高图马尔可夫神经网络中网络层的消息传播操作能力。需要注意的是,该方法应用于给定输入数据模型为的图结构数据模型的条件下。在实验分析和模型验证方面,本文使用图马尔可夫卷积神经网络(GMCN)对图数据结构的数据集Cora、PubMed、CiteSeer进行节点分类任务的训练和测试。该模型(GMCN)应用场景广泛,包括区分图中具有语义关系的物体的场景生成图,人体的动作识别,社交网络的推荐系统,生化领域大分子的特征提取,关系数据分类等改进工作的主要思想体现在GMNN进行推理和学习的GNN使用的是recurrent GNN(RecGNN),而GMCN进行推理和学习的GNN使用的是 convolutional GNN(ConvGNN)。节点分类研究领域工作的回溯主要体现在两个方面,包括传统的统计学习方法在节点分类任务上的应用和近几年的图深度神经网络在节点分类任务上的应用。在统计关系学习(SRL)文献中,半监督目标分类有很多种方法。他们通常采用概率图模型对标签依赖关系进行建模,实现对对象(节点)的分类目的。很多早期的方法都是欧几里德的方向性标记图像。但是这些方法的最终预测效果非常有限,只能利用数据之间的依赖关系标签。到为了克服这些缺点,后来很多SRL方法都采用了马尔可夫网络,代表性的方法有关系马尔可夫网络(RMN)和马尔可夫逻辑网络(MLN)。其中,RMN的集合分类过程是利用标签之间的相互作用对多个实体进行分类,提供了一致的概率基础。实践证明,丰富的关系模式集可以用于分类,比标准平面分类具有更高的分类精度。在某些情况下,关系特征可以合并到标准平面分类中。例如,在论文分类中,特定参考文献的存在可以简单地视为原子特征。结合相关实体(如单词)的基本特征可以帮助分类,但不能利用RMNs捕获的相关实体标记之间的强相关性。在技术方面,引入隐变量(即使在训练数据中没有观察到)可以获得显著的功率。RMN通常适用于任何关系域。特别是,社会网络提供了关于个人和组织之间互动的广泛信息。另外,MLN是一种将一阶逻辑模型与概率图模型相结合的方法。马尔可夫逻辑网络(MLN)是每个公式(或子句)都有权的网络。与表示域中对象的一组常量一起,指定了一个局部马尔可夫网络。对于知识库中的一阶公式,每个可能的地面包含一个特征,对应于MLNs中相应的权重,在查询所需的地面网络的最小子集上进行推理。通过迭代优化伪似然测度,可以有效地从关系数据库中学习学习权重。然后利用归纳逻辑编程技术学习附加子句代表性,简而言之,马尔可夫逻辑网络是一种简单的方法,结合概率和一阶逻辑在一个有限的领域。通过对一阶知识库中的公式(或子句)赋予权重,可以得到一个构造普通马尔可夫网络的模板。因为图的独特性,将深度学习应用于无处不在的图数据是非常重要的。最近,大量的研究致力于将深度学习方法应用于图,从而在图分析技术方面取得了有益的进展。本文回顾了不同类型的图形深度学习方法。根据模型结构和训练策略将现有的方法分为四类:图递归神经网络(GNN)、图卷积神经网络(GCN)、图注意神经网络(GAT),图马尔可夫图神经网络(GMNN)。对于RecGNN而言,图中的每个节点用一个低维特征向量表示。对于以图形为中心的任务,可以添加具有与整个图形相对应的唯一属性的特殊节点。RecGNN通常结合了一些早期的图形数据处理方法,如马尔可夫链和递归神经网络。RecGNN本身也包含几个缺点:首先,RecGNN在计算过程中的映射是压缩映射,这限制了RecGNN的建模能力。其次,由于梯度下降步骤之间的迭代次数较多,RecGNN的计算量较大。卷积运算在神经网络训练中有着广泛的应用。离散卷积的本质是一种加权和。通过共享参数的滤波器计算中心像素和相邻像素的加权和,构造特征图,实现空间特征的提取。通过对卷积核参数的优化,实现了特征提取的功能。传统的离散卷积方法(CNN)对非欧几里得结构的数据不能保持平移不变性。但是图神经网络可以从拓扑中提取空间特征。利用图的拉普拉斯特征值和特征向量,得到了研究图的性质的目的。图卷积网络中的图是指数学(图论)中利用顶点和边建立对应关系的拓扑图。图注意网络(GATS)是一种基于图结构数据的新型卷积神经网络。它具有利用隐藏的自我注意层的特点。在引入注意机制后,图注意层在这些网络中的计算效率很高。它的显著优点是不需要昂贵的矩阵运算,并且可以在所有节点图中并行,允许不同的重要性(隐式)分配给不同的节点。图注意网络(GATs)可以将注意机制应用于图神经网络。每层学习每个邻居对其生成的新特征的影响,然后根据影响程度对邻居特征进行聚合,生成新特征,适合于归纳学习任务。注意机制的优点是它能处理任意大小的输入问题,并将注意力集中在影响能力最大的输入上。在RNN和CNN中,注意机制都取得了很好的效果,并能达到目前先进的性能水平。马尔可夫图神经网络(GMNN)是集图神经网络和统计关系学习方法的优点于一身的深度神经网络。它可以在预测对象标记和模型之间学习有用的对象标记的客观表示。GMNN利用马尔可夫条件随机场建立了基于对象属性的对象标签联合分布模型。采用伪似然变分推断算法进行优化。在推理步骤中,采用图神经网络学习对象表示法进行标签预测。在学习算法中,采用另一种图神经网络来模拟标签之间的局部依赖关系。在以往的GMNN工作中,图神经网络RecGNN。GCN理论的很大一部分是引入可以优化的卷积参数。同时,通过改变GCN网络传播层的结构,可以有效地提高GCN消息传播的速度和效率。本文的目的是充分利用马尔可夫图神经网络和图卷积神经网络在半监督学习条件下的优良性能,提升图马尔可夫神经网络的特征提取能力。本文主要通过跟踪这些方法的发展历史,并对这些方法在节点分类领域的应用和效果进了概述。最后本文希望通过借鉴图卷积神经网络中(first-order)高效快速的网络传播层方法和图马尔可夫神经网络对于节点标签特征与标签依赖性的提取能力,构建一个图马尔可夫卷积神经网络。GMCN的创新部分主要体现在神经网络层之间的消息传播机制的改进,即将GMNN中用于推理和学习的RecGNN改良为GCN。一般情况下,GMCN中用于提取特征信息参数的图卷积神经网络(GCN)理论的很大一部分是对神经网络层参数进行优化。通过改变GCN网络传播层的结构,可以有效提高图卷积神经网络消息传播操作的速度和效率。因此本文具体的创新和改进工作体现在:通过改变图卷积神经网络的传播层结构和优化网络层的传播参数两个方面,并在此基础上对GMCN进行模型设计和构造,在参数优化实验中,本文通过改变神经网络优化器,学习率和迭代次数来进行探索。在对比实验中,本文与近几年在半监督条件下进行节点分类取得优异实验表现的几个图神经网络计算方法和统计关系学习方法进行结果对比,以此来证明GMCN模型的优越性。本文实验设计和方法验证工作主要体现在两个方面。一方面,通过改变图卷积神经网络的传播层结构。另一方面,通过优化参数两个对GMCN进行模型设计和构造,在参数优化实验中,本文通过改变神经网络优化器,学习率和迭代次数来进行探索。在对比实验中,本文与近几年在半监督条件下进行节点分类取得优异实验表现的几个图神经网络计算方法和统计关系学习方法进行结果对比,以此来证明GMCN模型的优越性。实验使用了Cora、CiteSeer、PubMed三个引用论文网络数据集,通过在具有引用关系(指向关系)的论文之间建立图结构的边,根据论文中出现的单词建立论文的特征信息,在此基础上建立图结构,将论文的种类(依照论文所属机器学习的研究领域划分,例如神经网络、基于案例、遗传算法等)设置为标签,在半监督条件下训练神经网络,输入图结构信息,最对未设置标签的论文进行种类的划分在Cora、CiteSeer两个个数据集上,训练集、验证集、测试集的设置大约为1:5:10,GMCN较之于以往的模型都具有更高的分类准确率,在PubMed数据集上,GMCN模型较之于GMNN模型表现略差。在参数选择方面,在迭代系数为10,优化器为Adam,学习率为0.05时模型取得最好的节点分类效果。综上所述,GMCN集统计关系学习方法和图神经网络优点于一身。它可以学习预测对象标签和模型之间对象标签的有用的客观表示。GMCN利用马尔可夫条件随机场对基于对象属性的对象标签联合分布进行建模。采用伪似然变分推断方法进行优化。在推理步骤中使用一个图卷积神经网络学习对象表示来进行标签预测。在学习步骤中,另一个图卷积神经网络用于建模对象标签之间的局部依赖关系。有效的提升了节点分类的准确率。
其他文献
股票是股份公司发行的所有权凭证,是股份公司为筹集资金而发行给各个股东作为持股凭证并借以取得股息和红利的一种有价证券。每股股票都代表股东对企业拥有一个基本单位的所有权。每家上市公司都会发行股票。这种所有权为一种综合杈利,如参加股东大会、投票表决、参与公司的重大决策、收取股息或分享红利差价等,但也要共同承担公司运作错误所带来的风险。获取经常性收入是投资者购买股票的重要原因之一,分红派息是股票投资者经常
学位
快速发展的汽车、电子与家电等行业,对模具质量提出了愈加严格的要求,从而对模具钢的要求也逐渐提高。但在模具钢锻造过程中产生的表面裂纹和冶金过程中遗留的孔洞缺陷,严重影响了产品的使用性能和寿命。利用有限元模拟技术对模具钢锻造过程进行模拟研究,可以了解锻件表面裂纹和内部孔洞缺陷的产生和演化规律,对实际生产具有重大意义。本文依托于“十三五国家重点研发计划”之“高性能工模具钢及应用”项目,以3Cr2MnNi
低共熔溶剂(DES)是一种类离子液体,由氢键给体和氢键受体混合而成。由于其制备简单、廉价易得、组成可调,可作为溶剂应用于有机反应和萃取分离中。低共熔溶剂通常呈中性或弱碱性。尽管很多酸催化剂广泛用于有机合成中,寻找一种新的绿色酸催化剂仍然是绿色化学和催化化学的难点。目前,强酸性低共熔溶剂的研究报道很少。本论文制备了一种强酸性低共熔溶剂,并以其为催化剂考察了多种有机转化反应,获得了良好的应用效果。在反
密码分析是一门研究利用特殊手段解密未知密码信息的学科。其中,差分分析是一种通过选择明文进行密码分析的攻击(分析)方式。日本密码学家Matsui(松井)于1995年发明了 Matsui算法,该算法长期以来都是差分分析自动化的主要方法——其主要贡献是攻破了 1 6轮的DES加密算法。相较于MILP(混合整数线性规划)等依托数学分析工具的自动化搜索方式,Matsui算法更加注重于加密算法本身的结构特性,
永磁同步电动机(permanent magnet synchronous motor,PMSM)相比于其它类型电机,具有结构紧凑、可靠性高、运行效率高、功率密度大、损耗小、外形尺寸设计相对灵活等诸多优点,故其应用范围变得越来越广泛。近些年来,为了降低电机调速系统成本、提高系统可靠性以及拓宽电机的应用场合,无传感器控制系统的应用逐步成为该领域的研究热点。然而转子位置跟踪速度、估计精度以及系统的稳定程
本文设计并实现了一种基于micro:bit的多功能扩展板。这种设计主要包括硬件和软件两个部分。设计的主要目的是为了扩展micro:bit的功能和性能。硬件设计的工作主要是在用Altium Designer 2019画出本文提出的扩展板的原理图,并根据原理图绘制相应的PCB电路图用于进一步加工。同时,原理图和PCB图都进行了相应的软件仿真测设并且加工得到了实物。集成在micro:bit扩展板上的各种
车牌识别技术作为计算机图像视觉识别研究领域的一个热门研究课题,在计算机发展的年份中已经不断有新的算法和技术手段被应用进来。常见的车牌检测识别一体化系统一般使用图像处理的基本图像预处理手段和基于模式识别的匹配技术进行识别。汽车车牌本质上可以看作汽车的身份证,车牌与汽车是唯一绑定的关系,通过对于车牌信息的准确获取,便可以获取到与当前车辆相关的各种信息。在常见的交通管理中,对于车牌的准确识别能够大幅提升
自适应波束形成技术作为阵列信号处理技术中的关键技术,在通信、雷达、射电天文、地震勘探、声纳、电子对抗等领域应用广泛。自适应波束形成技术可以定向地接收空间中某一特定方向上的信号,阻止其他方向上的信号进入系统造成干扰,具有空域滤波的效果。在无线通信系统中,自适应波束形成可以提高频谱利用率,扩充信号容量。随着无线通信需求的爆发式增长和无线通信技术的飞速发展,5G通信技术即将进入商用,未来智能设备将工作在
随着网络信息时代的到来,突发公共卫生事件中网络谣言的传播方式和特征发生了巨大变化,对事件本身的发展和社会秩序都造成了恶劣的影响,在此背景下,研究如何有效应对突发公共卫生事件中的网络谣言就显得尤为必要。本文在对国内外学者的相关研究成果进行研读的基础上,综合公共管理学、心理学、政治学等多学科视角,采用文献研究法、案例分析法和内容分析法,以新型冠状病毒性肺炎疫情期间的网络谣言治理为例,选取腾讯较真平台于
随着光通信行业的发展,人们对带宽的需求越来越高。单模光纤的通信容量已接近香农极限,难以满足日益增长的通信需求。为了克服光传输的能力限制,许多研究人员致力于空分复用的研究,这为光传输开辟了一个新的维度。模分复用作为空分复用的一种技术,通常采用由少模光纤支持的正交空间模式并行传输数据;该技术能够成倍提升单根光纤的容量,拥有广阔的前景。模分复用器和解复用器是模分复用系统的关键器件之一,本文提出了两种新型