论文部分内容阅读
随着当今世界信息量的迅猛增加和国际交流的日益频繁,以及计算机网络技术的迅速普及和发展,不同语言之间的交流障碍愈加明显和严重。因此,人们对机器自动、有效地在不同语言之间执行翻译的潜在需求也越来越大。同时,高质量的自动的机器翻译,正是计算语言学研究,甚至是人工智能领域的终极目标之一。
目前,基于统计的机器翻译以其优异的性能已经成为机器翻译领域的研究热点。本文主要针对其中的基于短语和基于句法的方法分别展开研究。
在统计词对齐模型方面,本文利用双语的句法重调序融合改善词对齐模型的性能。
在基于短语的统计机器翻译系统方面,本文的工作包括利用基于词和词位置相关信息的短语重调序模型加强短语间的重调序能力;在解码时融合知识库处理短语翻译模型未覆盖的待翻译片段。NIST2004上的评测显示,本系统在BLEU值上相对于Pharaoh系统取得了12.9%的相对提高。
在基于句法的统计机器翻译系统方面,本文首先实现了一个基于树到树的句法翻译模型,并在此基础上尝试融入短语翻译模型,用以改善句法翻译模型对于非句法结构处理不利的情况。由此,本文提出了一个基于句法-短语的统计机器翻译系统,并取得初步的效果。