论文部分内容阅读
随着对外交流的日益广泛,机器翻译的研究与实现有着重要的现实意义。同时,机器翻译的研究对于自然语言理解、人工智能、计算语言学等学科的研究也起着重要的推动作用,并对促进情报获取工作发展具有重要的意义。 机器翻译(MT)就是应用计算机实现从一种自然语言文本到另一种自然语言文本的翻译。20世纪90年代以来,机器翻译的方法基本上可分为两大类:理性主义的基于规则的方法和经验主义的基于语料库的方法。 本文以军队某部重点科研项目——英汉智能型机器翻译系统为基础,设计实现了机器翻译中的句型转换和译文生成等功能。本文首先论述了课题背景与意义,介绍了机器翻译的发展与研究现状及系统概况。然后对英汉两种语言进行对比研究,论述了英汉语言的特点及差别,并给出相应的消歧策略。接着重点介绍了句型转换和译文生成模块的设计、实现过程。最后给出系统实验结果。 针对英语中的疑问句等特殊句型,系统采用了利用句型转换对其进行处理的新策略。在格语法的基础上,本文提出了扩展的基于信息的格语法(EICG),并设计实现了基于EICG的句型转换器,将各种特殊句型转换为陈述句语序。 翻译是一个高度智能化的过程,单纯的运用某种方法都不能取得比较理想的翻译效果。因此,本文将经验主义的方法和传统的基于规则的方法相结合,在传统的规则体系下,引入翻译模式的支持,两种方法相互补充,设计实现了用于完成源语言的转换和生成工作的译文生成模块。 在基于模式的方法中,基于范例推理的思想,研究了语法信息和语义信息相结合的相似度计算方法。对原有匹配算法进行改进,设计了基于动态规划的句子相似度匹配算法及匹配原则。并给出语义相似度计算公式,通过语义相似度计算来保证对模式进行精确匹配。在基于规则的方法中,针对翻译中遇到的一词多义、介词附着等问题,结合本系统特点,制定了具有本系统特色的翻译规则对各种歧义情况进行处理,完成了短语级目标生成及句子级结构转换等功能。 在实验阶段,按照国家《机器翻译评测大纲》对系统分别进行了开放性和封闭性测试,由专家对译文质量进行了评估,并对实验结果进行了错误分析。实验表明,系统的译文质量可以达到87.5,翻译正确率可以达到88%。