论文部分内容阅读
在当今世界,随着信息的急剧增加,国际交流的日趋频繁,尤其是国际互联网络的逐渐普及,机器翻译的潜在需求越来越大:人们希望通过计算机可以从一种语言信息得到另一种语言的正确信息。机器翻译系统正是为了满足人们的这种愿望而发展起来的。自1954年美国乔治顿大学进行第一次试验以来,机器翻译已经发展了五十余年,经历了几起几落的曲折历程。人们对它的评价毁誉兼有。但不容忽视的是,经过机器翻译工作者的执着研究和反复探索,机器翻译无论从理论技术还是从实际应用方面都取得了长足的进步。 然而,现今大多数的机器翻译系统都是根据语言学家对两种语言进行语法规则的编写而进行的,但随着语法规则的复杂度提高、数量增多,机器翻译系统的翻译效果却愈来愈不尽人意。仅用语法和语义规则的编写显然存在着许多不足,因而机器翻译研究进入了统计方法和语料库方法的复兴阶段。虽然统计并不能解决所有的问题,但经过十多年的研究,语料库与统计方法还是在很大程度上改变了机器翻译和自然语言处理等研究领域的面貌。 本文对机器翻译系统的相关技术进行了探讨,收集了一定规模的蒙汉双语对齐语料,搭建了蒙汉统计翻译模型、汉语语言模型与系统解码器,初步实现了一个基于统计的蒙汉机器翻译实验系统。通过对蒙文复合词的切分、对翻译词典进行扩展等方法,提高了系统的性能。实验结果表明,在双语对齐语料极其缺乏的情况下,该实验系统的初步建立是成功的,翻译结果是合理的,相对传统的机器翻译系统智能性有所提高。