【摘 要】
:
随着计算机技术和互联网的迅速发展,各种信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的研究。指代消解是自然语言处理的重点和难点之一,在文本摘要、
论文部分内容阅读
随着计算机技术和互联网的迅速发展,各种信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的研究。指代消解是自然语言处理的重点和难点之一,在文本摘要、机器翻译、多语言信息处理和信息提取等诸多应用中都涉及到指代消解问题。而指代消解又综合了多种自然语言处理技术,它的解决依赖于词性标注、命名实体识别、名词短语识别、句法分析等相关技术。本文深入分析了现有的指代消解技术并进行了归类总结,并参考Soon(2001)给出的基于机器学习的指代消解框架,实现了一个指代消解的原型系统。在MUC-6和ACE2003上的实验结果表明,本文原型系统优于同类型的系统。由于指代消解是基于篇章的,引入句子含义将有助于指代关系的确定。本文主要针对与指代消解关系密切的语义信息展开,将语义类别、语义角色和语义相似度信息引入指代消解过程,并对每一种语义信息的作用都进行了详细的实验和分析。实验表明,在原型系统中分别加入上述三种语义信息后系统的性能均有所提高,三种语义信息结合后加入原型系统中达到了最好的效果,在ACE2003_NWIRE语料上的F值可以达到58.8,比原型系统提高4.6个百分点。说明这三种语义信息有利于指代消解问题的解决,且具有一定的互补性。最后本文给出了在其它语料中加入上述三种语义信息前后的实验结果,实验表明相关语义信息同样有助于其它语料中指代关系的确定,具有相当的普遍意义。
其他文献
移动机器人是一种能够在工作环境中自主移动并完成预定任务的智能系统,是机器人学和智能控制的一个重要研究领域,在工业、农业、民用以及军事等领域具有广泛的应用前景。在移
消息中间件是一种由消息传送机制或消息队列模式组成的中间件技术,利用高效可靠的消息传递机制进行平台无关的数据交流,并基于数据通信来进行分布式系统的集成。作为一个中间
近些年来,随着中国社会的发展以及高等教育水平的提高,每年毕业的大学生人数越来越多,就业成为当今大学毕业生面临的重要挑战之一。人才资源是生产力中最为活跃、最有价值的、最
随着中国加入WTO,我国各个行业的竞争也日趋激烈。企业保有客户留住利润的难度越来越大。如果企业还仅仅依靠产品本身似乎很难逃脱失败的命运。因此越来越多的企业将重点从“
互联网的发展让我们的生活世界成为了地球村,网络的便捷性使人们每时每刻都能够从网络上获取信息。随着Web2.0技术的应用,人们不再只是简单的获取网络上的信息,而是成为了网
未来的通信网络是一个包含多种不同接入技术的异构网络,不同技术的接入网络具有不同的覆盖能力、容量大小、以及对业务的不同服务质量支持能力等。一个端到端的QoS会话可能要
随着用户参与的不断加深,包含用户观点、态度以及对网络事件、产品评论的主观性文本迅速充斥着互联网。新闻、博客、论坛、贴吧等网络媒体用户数众多,成为了网络事件传播的主
自组织特征映射网络由Teuvo Kohonen教授在20世纪80年代提出,它是模拟脑细胞的这种自组织特性来实现聚类,识别,排序等。自组织特征映射网络同时具有拓扑保持和向量量化的特点
随着社会的发展,水资源短缺日益严重,节省水资源并实现水资源的回收利用是缓解水资源紧张的必然途径。中水是从污水中处理出来的低质量水,可用于工业冷却循环、绿化喷灌、道
成功的大规模系统被称为遗留系统。这些系统具有巨大的商业价值。但是因为它们的体积庞大,并且缺乏文档信息,所以难于维护。其中相似性代码是困扰工程师们的一大问题。在一个