依存句法分析的置信度研究

被引量 : 0次 | 上传用户:gustczh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析是自然语言处理的核心问题,对信息抽取、信息检索、机器翻译等应用有重要的支撑作用。依存句法以其形式简洁、易于标注、便于应用等优点为人所重视。虽然目前依存句法分析算法研究取得了一定的进展,但是其准确率仍然不能满足实际应用的需要。针对这一问题,本课题并没有将全部研究重点放在提高依存句法分析的准确率上,而是提出了对依存句法分析结果进行置信度分析这一新问题,通过对依存句法树中每条依存弧的置信度进行计算,将置信度高的依存搭配用于特定应用系统,从而提高这些系统的准确率。目前主要有两种主流的依存分析机制,一种是基于转移的依存分析,另一种是基于图的依存分析。针对这两种依存分析方法的不同,本文提出了相应的计算置信度的方法。基于转移的依存分析通过构造优化的转移序列来对句子进行解码,从而生成一棵依存句法树。其学习方式有局部学习(Local Learning)和全局学习(Global Learning)两种方式。针对局部学习的转移模型,本文提出基于似然概率以及基于重采样的置信度计算方法;针对全局学习的转移模型,本文提出基于K-Best结果投票的置信度计算方法。基于图的依存分析通过寻找最大生成树的方法获取一个句子的依存分析结果。其学习过程一般使用在线学习(Online Learning)算法。依存分析的图模型一般为线性模型,因此与基于转移的依存模型不同,其无法直接得到一条依存弧的似然概率。针对这一问题,本文首先利用图模型的输出近似估计依存弧的边缘概率,并以此作为该依存弧的置信度。同时,本文提出一种有指导的基于Logistic回归的置信度估计方法,该方法能够充分地利用更丰富的特征,并且通过有效的学习方式对特征进行赋权。另外,本文还提出了若干种置信度估计的评价方法,一方面可用以评价置信度计算结果的优劣,另一方面也为置信度计算提供了优化目标。最后,本文将含有置信度的依存句法分析结果应用于篇章级情感分析以及半指导依存句法分析,以观察其有效性。实验结果证明,对置信度信息的合理应用能够在一定程度上提高上层应用及依存句法分析自身的性能。
其他文献
降低高等级公路的造价一直是道路工程的一个重要课题。如何能够对一些大量堆存的工业废渣进行有效利用,是当前道路建设的一个热门话题,本文依托云南磷矿集团的横向课题,对当地工
随着转基因动物在新品种培育、异种器官移植、生物反应器和疾病模型等方面的研究与发展,转基因动物的生物安全性引起了人们的广泛关注。目前,各国政府与机构已制定了相应的法
2017年11月、2018年9月,甘肃省张掖市甘州区、高台县各有1批肉牛调往新疆途中在边境检查站被确诊口蹄疫疫情。本文就2起口蹄疫疫情的溯源和综合处置情况做一综述,以便为今后
在传统高校机房管理中,面临着庞大的软件系统快速更新、机器频繁使用、设备的故障率和病毒入侵频率不断提高等诸多问题的挑战。采用桌面虚拟化技术可以系统地、有效地解决高校
服务业经济的发展尤其是现代服务业经济的发展在20世纪得到了世界各国的重视,尤其是在西方发达国家服务业已经成为本国国民经济的重要组成部分。在全球化快速发展的经济背景下
研究背景:随着社会的高速发展,各种问题在社会中先后出现,如就业困难、贫富差距加大、医疗资源不足等,造成了人们在平时生活中的普遍焦躁,引发了一系列的心理问题,其中抑郁症
目的讨论冠状动脉造影与64排双源CT在冠心病的诊断中临床对比研究。方法选取我院发生冠心病的患者90例,选取的患者分别实行冠状动脉造影和64排的双源的CT检测,比较两种检测方
近年来,基于图像或视频的三维重建技术的研究和应用受到人们越来越多的关注,尤其是基于图像的三维重建技术的研究。立体匹配是三维重建中的关键环节。本文主要对高效的全局立体
本文针对骨外科手术诊断单纯凭借DR成像导致影像重叠、无法反映三维空间信息的弊端,提出了一种2D-3D非刚性配准及三维姿态估计方法,利用患者股骨正、侧位的DR图像和通用股骨的C