基于深度学习的二句式非充盈态汉语复句的关系识别

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:buzadi3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语复句的关系识别是对分句间语义关系的甄别,是复句语义分析的关键,旨在从文本中识别句间的关系类型。对于复句关系类型识别的研究有助于推动机器翻译、智能问答、自动生成文摘等领域的发展,进而提高其整体性能。由于汉语复句中非充盈态有标复句的关系标记不能够显性的表明复句所含的关系类型,所以,给此类复句的语义关系识别任务造成了困难。而本文将展开对非充盈态复句关系类别识别的研究。现有的较为主流的复句关系识别方法主要有两种,一种是基于语言学规则的,该方法主要是由语言学家针对大量的语料文本归纳总结的约束条件,并且建立的相应规则库。而另一种则是利用统计学方法,在大规模语料库中提取出复句的词面、字面上的特征,从而构建基于语料文本的特征工程。然而,这些方法所得到的特征集泛化性能较差,以至于识别的正确率不高。另外,特征的工程量较大,需耗费大量的人工和时间。为了能够深度地挖掘复句的特征集和复句蕴含的语义信息特征以及捕获到复句内分句间相互作用的语义关联信息,本文首次将深度学习方法应用到汉语复句语义关系处理中,并引入词嵌入模型对复句进行单词建模。本文所做的工作有:首先,本文采用从《长江日报》和《人民日报》以及部分当代小说中提取的文本语料构成复句语料库,统计并总结了复句的关系类别与所对应的关系标记。在上述基础上,本文还构建了二句式非充盈态复句语料库,并将该语料库作为本文课题研究的主要数据集。其次,本文提出了一种基于词聚类的CNN与Bi-LSTM相结合的网络模型。该模型先使用词聚类算法对单词向量进行建模,为了提取到单词间的语义相似特征,然后用CNN对复句深度建模以获得到复句的局部特征。另外,该模型对CNN进行了部分改进,从而自动识别复句的关系类别。然后,还提出了基于句内注意力机制的多路卷积神经网络模型方法。其中句内注意力机制模型同样是基于Bi-LSTM的。同时,为了充分利用文本特征,联合使用卷积神经网络(CNN)对复句表示再次建模获得句子局部特征。以此获得了更加充分且显著的特征表示,进而对复句的关系类别进行更好的预测。最后,本文所提出的基于深度学习的方法在二句式非充盈态复句的数据集上进行了验证。实验结果表明,基于词聚类的CNN与Bi-LSTM相结合的网络模型和基于句内注意力机制的多路卷积神经网络模型,它们的性能优于基于语言学规则和统计的学习方法,与此同时保证了模型的可拓展性。另外,由于基于句内注意力机制的多路卷积神经网络模型引入了分句间的语义信息关联特征的提取阶段,并利用注意力机制聚焦到句子内部更加重要的语义信息,因此对模型训练阶段语义特征的学习起到了很好的提示作用,增强了模型的学习能力,故后者模型效果更优于前者。
其他文献
以水淬镍渣为代表的含铁、硅系废渣年排放量达1000万吨以上,然而我国镍渣的利用率较低、大量堆积在渣场,既造成资源浪费又污染环境。目前国内外的主要研究重点是火法回收其中
行人检测旨在检测出图片或视频序列中是否存在行人并对其定位,通常用于智能监控、智能机器人以及自动驾驶领域中。作为众多任务的重要前置处理环节,它常常与行人跟踪、行人重
随着数据时代和信息时代的到来。信息和数据越来越成为社会经济发展和人们生活提高的重要推动力。而检索作为高效获取信息方法就显得尤为重要。跨模态检索作为获取跨模态信息
随着城市人口的显著增长,人们物质生活水平不断提高,各类大型人群集聚活动不断增多,极易导致踩踏安全事故。对人群场景的智能实时监控引起了重点关注,通过对实时监控视频自动
近年来,随着大数据和人工智能技术的迅猛发展,社交网络、引文网络等应用越来越多。对于这些应用程序,一个独特性就是它们的数据由网络结构表示,其中节点表示实体,边表示节点
近年来,海上船舶遇险事件时有发生,而能够对遇险目标展开快速、精准的搜救是一个迫切的而且具有挑战性的任务。在对海面遇险目标的搜救过程中,主要应用的是红外成像技术。由
知识图谱作为信息时代一个十分重要的工具,已经在信息检索,知识问答,推荐系统等诸多方面扮演着愈加重要的角色。随着大数据信息时代的到来,日益增长的数据难以满足人们获取精
多核多线程系统的任务调度是当前高性能处理器研究的热点之一。近年来,针对当前多核处理器任务调度问题,出现了许多的研究方案。旨在减少通信开销、缩短任务调度长度、提高处
随着科学技术和现代工业的迅猛发展,对材料的强度、硬度和塑韧性等性能提出了越来越高的要求。金属间化合物大多具有高的硬度和强度,在制备高强度新材料领域有巨大的应用前景
我国城市污水处理行业飞速发展,近年来污水厂污泥产量日益剧增,污泥有效处理势态日趋严峻。我国目前应用最为广泛的方法是污泥填埋法,要实现填埋场的可持续发展,延长填埋场使