论文部分内容阅读
随着移动互联网技术迅猛发展,网络用户数急剧增加,随之产生了成千上万的具有连接关系的文本网络数据。利用深度学习技术从复杂结构的网络中挖掘出网络中隐含的内在规律,对于分析研究网络行为和网络节点之间的隐形联系有重要的理论意义和应用前景。本文利用图卷积网络(GCN)对文本分类进行了深入的研究和分析,提出了几个高低阶图卷积网络模型来提高文本分类的准确度。本文主要工作如下:在捕捉文本节点信息方面,针对GCN的浅层机制限制和多层(>2层)GCN的过平滑问题,本文设计了基于权重共享机制的高低阶图卷积来同时捕捉文本节点的高低阶邻域信息。为了融合不同阶图卷积提取到的高低阶邻域特征,提出了4种信息融合方案,包括最大值信息融合池化、均值信息融合池化、求和信息融合池化、求反最小信息融合池化。根据提出的4种信息融合方案,提出了对应的4种基于高低阶图卷积网络的文本分类算法。此外,本文分析了这些模型的计算复杂度和参数量。实验结果表明,提出的高低阶图卷积网络能有效捕捉文本节点的一阶邻域和高阶邻域信息和学习全局图结构。为了避免高低阶图卷积网络产生过拟合问题,进一步提出了基于无隐藏层的图卷积网络的文本分类算法。该文本分类模型的核心在于提出的多跳图卷积层。多跳图卷积包括多幂邻接矩阵、多跳特征传播和多跳线性变换三个阶段。相比高低阶图卷积网络,该网络能学习更多更丰富的文本节点特征,提高了文本分类的性能。