一种基于规则的汉语分析系统的设计和实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:a5354796
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从计算语言学兴起到现在已经有几十年的时间了,在这几十年里,不少计算机专家、语言学家在自然语言处理领域付出了不懈的努力,许多研究思想和设计方法也应运而生。机器翻译作为自然语言处理领域的一个重要分支,在经过了长期的探索和研究之后,已初步进入应用。随着计算机应用的普及和Internet的高速发展,人们对机器翻译提出了更高的期望,机器翻译研究者和开发人员也面临着更大的挑战。 汉语分析一直是机器翻译研究中的一个难点,研究一种适合于机器处理的汉语分析的新方法有助于今后汉语到其他语种的机器翻译研究。 本论文继承了前人一些行之有效的思想方法,结合汉语自身的特点,提出了一种基于规则的汉语分析方法。 论文的主要工作有: 1.介绍了几类经典的基于短语结构文法的自然语言处理技术,同时对这些技术的各自特点和适用面进行了分析,并指出了它们对汉语分析的指导作用。 2.对汉语的特点进行了深入细致的分析,并系统地整理和归纳了这些特点对汉语分析特别是句法分析带来的难度。提出汉语句法分析系统必须在利用现有成熟的自然语言分析理论和技术的基础上,着重针对汉语分析的特殊困难来考虑系统的设计思路。 3.分析了汉语层次性的特点。提出汉语分析的目标是把汉语句子解析成基于多值标记函数的依存关系树。动词是这棵树的树根,句子的其它成分通过格与其建立关联。树上的节点不仅有词法、句法等表层信息,还携带深层格关系的语义信息。 4.在研究了汉语简单句的格关系的基础上,提出了汉语复句构成的关系格,并通过实例列举了复句格之间的组合模式。同时由于汉语短语和句子在构造上具有一致性,在分析过程中发现其在关系格上也具有一致性。 5.指出了汉语分析基于规则的必要性。采用规则语言的方式对汉语分析规则进行统一描述。规则描述语言提供了包括条件语句、循环语句在内的多种描述语句,规则采用了多行描述,有较强的表达能力。规则类型分为个性规则和共性规则,并对规则的具体功能进行了细分。 6.根据词汇语义驱动的思想,把分析词典设计成参数加上与该词有关i的个性规则的形式。在词汇这一级对分析规则进行了细化,既使用了语法总结出的规则,又兼有基于实例的分析方法优点。在分析过程中可以根据这些个性规则执行特殊的分析动作。 7.在充分认识汉语分析难点基础上,结合经典的计算语言学理论和成熟的自然语言分析方法设计了一个汉语分析系统原型,并取得了较好的效果。同时对系统得到的分析结果进行了仔细、深入的分析。针对规则方法的缺陷提出了以规则为主体,引入其它辅助分析手段的混合策略,从整体上提高汉语分析系统的性能。
其他文献
该文详细介绍了基于特权提升的安全评估模型(a Quantitative Model forSecurity Risk Assessment based on the Prvilege-escalating thcory,SPARM)的结构和评估策略.首先,模
该文首先研究了Parlay API体系结构,并分析了Parlay API的实现方式.Parlay API处在上层应用与底层网络资源之间,其实现分为两部分:一部分称为Parlay客户端,就是应用服务器,由
该文首先对度量和软件度量的一些基本概念进行了介绍,根据软件度量的发展历史说明其成功与失败之处,同时指出了软件度量在软件项目的开发中,特别是在航天型号软件研发中的重
该文系统地分析了数字水印技术的基本原理和方法,提出了两种较为理想的水印算法:基于信息论的小波域水印算法和基于图像内容的水印算法.通过各种常见的图像处理、压缩及各种
随着互联网的发展,计算机木马变得越来越猖獗,在网络安全是如此重要的今天,如何有效的检测和预防计算机木马,逐渐成为网络安全界的热点。传统单一的木马检测方法无论是基于静态文
云计算是近几年来的提出的一种计算模式,是并行计算、网格计算和分布式计算发展的产物。云计算的本质特征就是分布式的计算、存储、用时付费、和高扩展性能,具有伸缩性、可靠
该文先介绍了防火墙的发展状况和所使用的核心技术,然后介绍了该系统所实现的功能.该文所采用的主要技术是底层驱动技术、状态检测技术、连接跟踪技术、协议解析技术以及内容
该文充分调研了国内外远程教育规范/标准体系,认真研究了写作工具应该遵守的规范/标准:学习对象元数据规范/标准、学习对象内容包装规范/标准、学习对象运行环境规范/标准和
随着高科技信息化时代的到来,人工智能技术的开发和应用逐渐成为了研究中的热点问题。图片和视频中的文字包含了大量的语义信息,因此可以被应用到人工智能系统的各个领域,如图片
该文提出了一种新的旋转不变纹理分类方法——基于灰度-梯度共生(GGC)/环形Gabor滤波(CGF)联合分类法.该方法将基于灰度-梯度共生的旋转不变纹理分类和基于环形Gabor滤波的旋