一种基于规则的汉语分析系统的设计和实现

来源 :南京大学 | 被引量 : 0次 | 上传用户：a5354796

【摘要】

：

自从计算语言学兴起到现在已经有几十年的时间了，在这几十年里，不少计算机专家、语言学家在自然语言处理领域付出了不懈的努力，许多研究思想和设计方法也应运而生。机器翻译作为

【作者】

：

王鹏

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2003年期

【关键词】

：

自然语言处理机器翻译汉语分析系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自从计算语言学兴起到现在已经有几十年的时间了，在这几十年里，不少计算机专家、语言学家在自然语言处理领域付出了不懈的努力，许多研究思想和设计方法也应运而生。机器翻译作为自然语言处理领域的一个重要分支，在经过了长期的探索和研究之后，已初步进入应用。随着计算机应用的普及和Internet的高速发展，人们对机器翻译提出了更高的期望，机器翻译研究者和开发人员也面临着更大的挑战。汉语分析一直是机器翻译研究中的一个难点，研究一种适合于机器处理的汉语分析的新方法有助于今后汉语到其他语种的机器翻译研究。本论文继承了前人一些行之有效的思想方法，结合汉语自身的特点，提出了一种基于规则的汉语分析方法。论文的主要工作有： 1.介绍了几类经典的基于短语结构文法的自然语言处理技术，同时对这些技术的各自特点和适用面进行了分析，并指出了它们对汉语分析的指导作用。 2.对汉语的特点进行了深入细致的分析，并系统地整理和归纳了这些特点对汉语分析特别是句法分析带来的难度。提出汉语句法分析系统必须在利用现有成熟的自然语言分析理论和技术的基础上，着重针对汉语分析的特殊困难来考虑系统的设计思路。 3.分析了汉语层次性的特点。提出汉语分析的目标是把汉语句子解析成基于多值标记函数的依存关系树。动词是这棵树的树根，句子的其它成分通过格与其建立关联。树上的节点不仅有词法、句法等表层信息，还携带深层格关系的语义信息。 4.在研究了汉语简单句的格关系的基础上，提出了汉语复句构成的关系格，并通过实例列举了复句格之间的组合模式。同时由于汉语短语和句子在构造上具有一致性，在分析过程中发现其在关系格上也具有一致性。 5.指出了汉语分析基于规则的必要性。采用规则语言的方式对汉语分析规则进行统一描述。规则描述语言提供了包括条件语句、循环语句在内的多种描述语句，规则采用了多行描述，有较强的表达能力。规则类型分为个性规则和共性规则，并对规则的具体功能进行了细分。 6.根据词汇语义驱动的思想，把分析词典设计成参数加上与该词有关i的个性规则的形式。在词汇这一级对分析规则进行了细化，既使用了语法总结出的规则，又兼有基于实例的分析方法优点。在分析过程中可以根据这些个性规则执行特殊的分析动作。 7.在充分认识汉语分析难点基础上，结合经典的计算语言学理论和成熟的自然语言分析方法设计了一个汉语分析系统原型，并取得了较好的效果。同时对系统得到的分析结果进行了仔细、深入的分析。针对规则方法的缺陷提出了以规则为主体，引入其它辅助分析手段的混合策略，从整体上提高汉语分析系统的性能。

其他文献

量化的安全风险评估模型的研究

该文详细介绍了基于特权提升的安全评估模型(a Quantitative Model forSecurity Risk Assessment based on the Prvilege-escalating thcory,SPARM)的结构和评估策略.首先,模

学位

安全评估特权提升量化计算动态算法网络安全

分布式业务平台应用程序接口的研究与实现

该文首先研究了Parlay API体系结构,并分析了Parlay API的实现方式.Parlay API处在上层应用与底层网络资源之间,其实现分为两部分:一部分称为Parlay客户端,就是应用服务器,由

学位

Parlay API框架Parlay网关体系结构Java语言

改进的软件项目度量框架

该文首先对度量和软件度量的一些基本概念进行了介绍,根据软件度量的发展历史说明其成功与失败之处,同时指出了软件度量在软件项目的开发中,特别是在航天型号软件研发中的重

学位

软件度量软件开发网络结构操作可行性度量元数据采集表

图像鲁棒性盲数字水印算法研究

该文系统地分析了数字水印技术的基本原理和方法,提出了两种较为理想的水印算法:基于信息论的小波域水印算法和基于图像内容的水印算法.通过各种常见的图像处理、压缩及各种

学位

数字水印抖动调制盲检测鲁棒性图像特征点

特种木马检测系统的设计与实现

随着互联网的发展，计算机木马变得越来越猖獗，在网络安全是如此重要的今天，如何有效的检测和预防计算机木马，逐渐成为网络安全界的热点。传统单一的木马检测方法无论是基于静态文

学位

木马检测系统数据采集模式匹配算法关联规则挖掘算法系统设计数据挖掘网络安全

云计算环境下云银行模型服务质量度量方法研究

云计算是近几年来的提出的一种计算模式,是并行计算、网格计算和分布式计算发展的产物。云计算的本质特征就是分布式的计算、存储、用时付费、和高扩展性能,具有伸缩性、可靠

学位

云计算云银行模型服务质量度量

基于内容过滤的防火墙系统的设计与实现

该文先介绍了防火墙的发展状况和所使用的核心技术,然后介绍了该系统所实现的功能.该文所采用的主要技术是底层驱动技术、状态检测技术、连接跟踪技术、协议解析技术以及内容

学位

网络安全防火墙包过滤内容过滤模糊匹配

学习对象写作工具的设计与开发

该文充分调研了国内外远程教育规范/标准体系,认真研究了写作工具应该遵守的规范/标准:学习对象元数据规范/标准、学习对象内容包装规范/标准、学习对象运行环境规范/标准和

学位

学习对象写作工具元数据DCIMSLOMSCORMCELTS

图片视频中的文字提取算法研究

随着高科技信息化时代的到来，人工智能技术的开发和应用逐渐成为了研究中的热点问题。图片和视频中的文字包含了大量的语义信息，因此可以被应用到人工智能系统的各个领域，如图片

学位

图片视频叠加文字分割文字提取时间域定位类笔画边缘检测算子K-均值聚类

旋转不变纹理分类研究及实现

该文提出了一种新的旋转不变纹理分类方法——基于灰度-梯度共生(GGC)/环形Gabor滤波(CGF)联合分类法.该方法将基于灰度-梯度共生的旋转不变纹理分类和基于环形Gabor滤波的旋

学位

纹理分析纹理分类模式识别Gabor滤波图像分析

一种基于规则的汉语分析系统的设计和实现

与本文相关的学术论文