基于图卷积网络的文本分类方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:net_worm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是自然语言处理中一个经典而重要的主题。如今,每天都会产生海量的文本信息,为了更加有效地利用这些资源,对文本的准确分类显得十分重要。现存的很多文本分类方法都侧重于如何表示文本,然后使用传统算法或深度学习方法进行分类,但是这些方法假设文本之间相互独立,并没有考虑文本与文本、文本与单词之间的相互关系,因此不能有效处理类似引文网络的文本分类问题。实际上文本之间的引用关系比较重要,有助于提高分类结果,对此本文提出了基于图卷积网络的文本分类方法。首先,介绍了文本分类基本流程和所需的基础知识。然后,使用稀疏表示的重构系数来构建文本与文本的关系,采用TF-IDF来评估单词对文本的重要性,从而构造了一个包含文本和单词的图结构数据,邻接关系通过邻接矩阵来表示。接下来,基于谱图理论,卷积神经网络被泛化为可以直接处理任意图结构数据的图卷积网络,提出了基于图卷积网络的半监督的文本分类方法,在不同数据集上的实验都取得了不错的分类准确率,对影响分类效果的因素进行了分析,并指出有词编码的作用。最后,由学习到的词编码给出文本的图表示,引入有参数的图池化方法,在此基础上提出了有监督的图分类模型用于文本分类,在MR数据集上的实验证明了方法的有效性,以及间接验证词编码的质量。本文的研究成果包括采用稀疏表示来构造图结构数据,引入了有参数的图池化方法,提出了两种基于图卷积网络的文本分类方法:一种是半监督的节点分类模型,一种是有监督的图分类模型,且两种方法取得不错的效果。
其他文献
表面包覆是改善锂离子电池正极材料性能的重要手段之一。总结了锂离子电池正极材料表面包覆的常用方法 介绍了包覆物质的种类及研究现状 讨论了包覆改善正极材料性能的机理
【据《Lancet》2014年5月报道】题:儿童烧伤患者的治疗标准和进展(作者Marc G Jeschke等)$$ 在美国,每年有超过50万例的烧伤患者需要救治。虽然大部分患者的伤情并不严重,但
期刊
<正>就像我们一样,全球人口也正在老龄化。我们正在进入"超高龄社会"时期(意味着超过65岁的人口占总人口的21%),政府、社区和企业需要接受这个事实。为应对这个问题,ISO成立
目的 研究传染性非典型肺炎又称严重急性呼吸综合征(SARS),探讨患者在不同发病阶段血清中多种细胞因子的变化、发病机理及与免疫反应的关系。方法 应用Randox公司产生的EVIDE
文化建筑既可被理解为"承载文化内容"的"建筑实践",也可被理解为以"建筑作为媒介"的"文化实践"。对于前者,建筑作为一种"容器",文化作为一种"存在";对于后者,建筑作为"文本",文化成为一种"生
会议
运用文献计量法,对国务院发布的4个政策性文件和118篇关于旅游企业的论文进行分析。研究结果表明:我国具有旅游业发展的良好政策环境,旅游企业的研究涉及多个学科领域,核心作
随着人们生活水平的提高,外出旅游已成为一种习以为常的生活方式,年轻旅游者更加注重于亲身体验活动,旅游过程中的娱乐性、竞技性、健身性已成为旅游的主流,"体育+旅游"的模
以砷单质和氟气为原料,采用气固法制备三氟化砷,研究了反应温度和反应物氟气压力对反应的影响。结果表明,制备AsF3的最佳条件:反应过程温度控制在300℃左右,氟气压力控制在0.1
目的观察狼疮性肾炎(LN)患者血清miR-4532、miR-2861表达变化,并探讨其临床意义。方法选择80例LN患者,其中活动期组(SLEDAI评分≥10分)42例、稳定期组(SLEDAI评分<10分)38例,
环境意识的不同表现形态中,学术形态作用明确、起先导作用,未来形态作用较固定。政府形态和大众形态之间的相互影响有两种模式:一是大众形态影响政府形态,为自下而上模式;二是政府