指代消解中待消解项识别研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:hechangying1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
指代消解是自然语言处理的重点和难点之一,在信息抽取,文本摘要等应用中都涉及到指代消解问题。待消解项识别是指代消解的一个子任务,是制约指代消解性能的关键要素之一,也是目前指代消解研究的一个重要内容。本文深入探讨了多种待消解项识别方法,如规则方法、特征方法、树核函数方法等,并重点探索了依存关系理论驱动的待消解项识别,尝试使用复合核函数将特征信息和结构化信息有机结合起来进行待消解项识别。在规则方法研究中,分析各类别待消解项所具有的特点,从语法、句法等角度归纳出较为有效的启发式规则。在特征方法研究中,为每个类别的待消解项制定既符合自身特点又包含上下文信息的特征集,使用机器学习方法构造待消解项识别分类器,将其作为过滤器加入指代消解平台,使指代消解平台的F值提高了0.8~2.2。在树核函数方法研究中,重点研究了结构化信息的获取问题,即句法树的裁剪,提出了左右扩展策略、层次延伸策略和动态扩展策略。在ACE2003英文语料上的实验表明,动态扩展策略取得了较好的效果。基于动态扩展树的待消解项识别分类器能将指代消解平台的F值提高0.6~1.7。句法树的裁剪是基于树核函数的待消解项识别方法的核心问题,本文提出了基于依存关系的句法树裁剪策略,与其他研究人员的成果相比,它能够更好的获取识别待消解项所需的结构化信息,同时能有效滤去噪音,因此基于依存关系的待消解项识别分类器取得了最佳的性能,将其作为过滤器加入指代消解平台后,基准平台的F值提高了2.4~3.6。本文还对基于树核函数的待消解项识别方法做了进一步研究,内容包括:尝试将待消解项识别分类器的判断结果作为指代消解的一个特征、基于依存树的待消解项识别研究、基于复合核函数的待消解项识别研究。
其他文献
随着Internet的快速发展与普及,计算机软件面临的环境开始从静态封闭逐步走向动态、开放和多变。为了适应这种发展趋势,网构软件(Internetware)成为一种新的软件形态,能感知外部
随着第三方物流产业的蓬勃发展,从事第三方物流企业的市场竞争尤其激烈,企业要想在市场中生存并发展,提供高效、快捷、方便的物流服务至关重要。物流信息化能够帮助企业提高
人工免疫系统的研究旨在抽取生物免疫系统中独特的信息处理机制,研究和设计相应的模型和算法,进而解决各种复杂问题。人工免疫是继人工神经网络、进化计算之后新的智能计算研
无线传感器网络是一种全新的信息获取平台,具有快速展开、适应性强等特点,有着广阔的应用前景。基于无线传感器网络节点数量众多、密集分布、节点读数相关性高且能量受限等因
多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。对于多关系的数据挖掘研究,如何高效地挖掘以及如何提高算法的可扩展性,一直是大家研究的重点。与传统的数据挖掘
组合测试是一种科学有效地软件测试方法,它能在保证软件质量的前提下,以较少的测试用例检测待测软件系统中各个变量以及它们之间的相互作用对系统产生的影响,实践证明其具有
随着社会交通运输的快速发展,越来越多的长途客货运驾驶员忙碌在工作岗位,因疲劳驾驶出现的事故频繁发生。因此,疲劳驾驶检测的相关研究意义重大。其中基于计算机视觉的检测
舵机最早出现在航模设计中,在航空模型中,飞行器的各种飞行姿态是通过调节发动机和各个控制舵机来实现的。而随着航空技术的发展,航空装备越来越复杂,对舵机的可靠性和控制要
近年来我国人民的消费出现快捷多样的特征,民众对时鲜果蔬、水产乳品等生鲜产品的需求逐年增加。采用全程低温运输以保证食品质量的冷链物流(cold chain)悄然兴起。但数据表
虚拟植物是指利用虚拟现实环境对植物的生长过程进行模拟的技术。虚拟植物是一个综合性研究课题,涉及到应用数学,计算机科学,农林学,生态学等学科理论,是当前的一个研究热点