论文部分内容阅读
近年来,深度学习迅猛发展,在诸多应用领域取得了令人惊喜的成绩。从语音识别、机器翻译、图像识别与计算机视觉都有相关的理论突破与实际应用落地。然而随着信息技术的发展,承载信息的载体不仅仅局限于文字,音视频或者图像等数据。以社交网络、引文网络、通讯网络和生物网络为代表的关系型数据也包含了许多信息。分类是数据挖掘的一种重要方式,利用分类结果能够得到社交网络中用户的兴趣、爱好、价值观或者是引文网络中文献所属的研究领域。本文所研究的问题是基于深度学习的方法完成节点分类任务。节点本身包含了大量的表示节点属性的内容信息,节点与节点之间通过边表示了节点的连接信息,本文希望提取上述两类信息并完成节点的单标签分类与多标签分类任务。图卷积网络Graph Convolutional Networks(GCN)是利用深度学习实现节点分类任务的一种模型,能够将节点的内容信息和连接信息进行融合,并对未观测到的节点进行标签分类。然而这种模型存在着涉及复杂矩阵运算,解释能力不足的缺点。针对上述问题,本文基于前人的研究对模型进行了改进,主要研究工作如下:1)本文提出一个通过图卷积提取节点特征并实现节点分类的模型,该模型接受一个节点上附有辅助信息的无边权矩阵的拓扑图数据,直接对拓扑图数据上的节点进行操作,避免复杂的矩阵运算,以自然直观的方式综合节点辅助信息和空间结构信息得到节点的低维向量表示,并实现进一步的分类任务。2)本文引入了注意力机制使得模型在卷积操作中针对某一个节点,能够赋予各个邻接节点不同的卷积参数,以此参数对邻节点特征进行加权求和实现中心节点内容信息和局部连接信息的提取。本模型使用神经协同过滤Neural Collaborative Filtering(NCF)的方式实现注意力机制。本模型通过更加合理邻节点抽取策略降低了算法模型的时间复杂度,通过跳连接(skip connection)机制强调对中心节点特征信息的保留。3)本文中提出的模型与算法基于Python语言和Tensorflow深度学习框架实现算法模型。使用2个公认的基准数据集进行对比实验,对现有研究领域中不同的算法模型进行了对比验证,证明了本文中提出的算法模型在节点分类任务上的可行性。此外本文还通过设计实验验证了模型结构设计的合理性。