基于深度神经网络的英文文本蕴含识别研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:ytdpg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,互联网上的文本数据也与日俱增。所以,快速高效地获取有用的信息变的相当重要。在自然语言处理领域,一项针对计算机“理解”文本的基础技术—文本蕴含识别已经引起越来越多研究者的关注。文本蕴含识别即判断两段文本在语义上的蕴含关系[1]。目前英文文本蕴含识别任务面临的主要问题如下:英文文本中大量的近义词、简称、代称等词汇对于蕴含关系识别的影响;由于英文语法结构的多样性,同样的文本含义具有不同的表述形式;英文文本蕴含识别需要深层次的语义理解。通过分析目前英文文本蕴含识别任务面临的主要问题以及前人工作的缺陷,针对英文文本蕴含识别任务,本文提出了一种基于深度神经网络的英文文本蕴含识别方法。该方法首先对文本进行预处理,使用长短时记忆神经网络对文本进行语义信息提取,基于注意力机制对文本进行软对齐,然后使用前馈神经网络进行语义比较,通过池化采样比较结果,最后使用前馈神经网络进行蕴含识别。在深度神经网络训练完成之后,将深度神经网络自动提取的特征与传统语言学特征相融合,提高特征多样性,重新进行蕴含识别。实验结果表明,本方法在 2015SNLI(Stanford Natural Language Inference)数据集上的准确率为0.878,最好结果为0.889[2],相差0.011,与最好结果的方法相比,本方法的模型参数更少。本方法在TAC会议于2011举办的RTE7的评测数据集上的F-Score为0.420,其中召回率为0.518,超过评测最优结果IK0MA[18]的召回率(0.491)。本文的主要贡献如下:1.提出了基于注意力机制对文本进行软对齐的方法,以解决英文语法结构的多样性问题。本方法使得对文本的语义分析不再依赖语法结构的解析,一定程度上解决了英文文本中大量复杂语法句式影响蕴含关系识别的问题。2.融合了多种神经网络模型的优点,提出了一种基于深度神经网络的英文文本蕴含识别方法。本方法相比传统机器学习方法不再依赖于人工特征的提取,通过深度神经网络的构建,深入语义层面进行特征的提取,使得蕴含关系的判断更加准确。3.提出了一种结合传统机器学习与深度学习的集成学习方法。本方法将深度神经网络自动提取的蕴含识别特征与传统机器学习方法中使用的人工特征相融合组成新的特征,并使用该特征重新进行蕴含识别,该方法提高了特征的多样性,进一步提高了蕴含识别的准确率。
其他文献
为了能够使新媒体行业得到更好的发展,本人就新媒体行业中的重要组成部分之一——新闻记者的职业素养方面进行研究和分析。本文首先讲述了新媒体行业的基础内容,在此基础上研
目的分析老年全髋关节置换术椎管内麻醉的临床效果。方法将60例接受全髋关节置换术的老年患者根据麻醉方式的不同分为2组,每组30例。对照组患者予以全身麻醉,对观察组患者采
[目的]分析不同品种睡莲花茶的化学成分,为其营养、保健价值研究及资源的综合开发利用提供科学依据。[方法]系统分析“爱德拉多”和“蓝鸟”这2个品种的营养成分差异、生理活
对桥梁上部后浇带(湿接缝)施工技术做全面介绍。
随着科学技术的不断进步,信息传播速度的不断加快,融媒体也迎来了它的快速发展时代。而且人们知识水平的不断提升,也使得他们的接受能力不断增强,这也使得新闻传播的形式突破
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着媒体融合时代的来临,新媒体当前的发展势头很猛,在新闻传播方面做出了不小的成绩。传统媒体也由此受到了来自新媒体的冲击与挑战,如果新闻记者不做出相应的转型与发展,传
住宅、小汽车将成为我国城市住房制度改革后,大城市居民的两大消费热点,随之也会带来大城市空间结构布局的改变。以上海为例,未来居民购买小汽车与住宅联合消费使居住与交通协同
目的:检测类风湿性关节炎(RA)患者、骨关节炎(OA)患者以及健康对照(HCs)人群血清钙卫蛋白水平,评估血清钙卫蛋白对于类风湿性关节炎的诊断价值,并进一步探讨其与RA患者临床和