论文部分内容阅读
本文在借鉴以往机器翻译研究的理论和方法的基础上,充分利用日语和蒙古语在语法结构上极为接近的特征,研究实现了一套日蒙机器翻译系统。在系统资源方面,我们利用日本每日报2002年版,随机选择了农、林、牧、水相关报道800多篇建立了语料库,在此基础上编写了日蒙词干词典。在本文研究中,引用日语新语法即派生文法,研发了基于派生文法的日语句法分析器。为了提高日蒙机器翻译的性能,本文从以下几个方面着重进行了研究:(1)为了充分利用派生文法与蒙古语语法的相似特征,有必要把基于传统语法的日语词法分析器分析出来的结果重新分析,使其成为具有派生文法中所定义的附加成分形式。为此,研发了基于派生文法的附加成分分析器,实现了从基于传统语法词法分析到基于派生文法词法分析的转换。(2)提出了基于蒙古语语序的日语句节调序方法,解决了动词句节翻译中出现的语序错误问题。首先制定了调序规则,然后以此为据进行调序,为形成蒙古语句节自然顺序提供了有力保障。与此同时,采取了相应措施解决了同形附加成分的区分和サ变名词和サ变动词翻译难问题。(3)对日语功能词语义分析及其蒙古语翻译问题提出了一些看法,在一定范围内解决了功能词翻译难题。(4)制定句法分析规则,研发了基于派生文法的日语句法分析器。克服了日语句法分析器KNP在一个句节中出现开括号、闭括号、逗号、句号等对符号的处理、句节翻译以及整个句子的翻译带来的负面影响,并实现了日蒙句法分析及转换。我们在上述研究的基础上实现了日蒙机器翻译系统并进行了评测实验。以测试数据库的30个新闻报道作为对象,用本系统进行了翻译,对其生成的187个句子(评均词数为27.1个)进行了评价。正确翻译句子为150个,准确率达到了80.2%。在句法分析测试中,针对同语料库的310个新闻报道的1519个句子进行自动句法分析,其结果未出现出误。