基于统计的蒙汉机器翻译系统

被引量 : 21次 | 上传用户:gzlwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今世界,随着信息的急剧增加,国际交流的日趋频繁,尤其是国际互联网络的逐渐普及,机器翻译的潜在需求越来越大:人们希望通过计算机可以从一种语言信息得到另一种语言的正确信息。机器翻译系统正是为了满足人们的这种愿望而发展起来的。自1954年美国乔治顿大学进行第一次试验以来,机器翻译已经发展了五十余年,经历了几起几落的曲折历程。人们对它的评价毁誉兼有。但不容忽视的是,经过机器翻译工作者的执着研究和反复探索,机器翻译无论从理论技术还是从实际应用方面都取得了长足的进步。 然而,现今大多数的机器翻译系统都是根据语言学家对两种语言进行语法规则的编写而进行的,但随着语法规则的复杂度提高、数量增多,机器翻译系统的翻译效果却愈来愈不尽人意。仅用语法和语义规则的编写显然存在着许多不足,因而机器翻译研究进入了统计方法和语料库方法的复兴阶段。虽然统计并不能解决所有的问题,但经过十多年的研究,语料库与统计方法还是在很大程度上改变了机器翻译和自然语言处理等研究领域的面貌。 本文对机器翻译系统的相关技术进行了探讨,收集了一定规模的蒙汉双语对齐语料,搭建了蒙汉统计翻译模型、汉语语言模型与系统解码器,初步实现了一个基于统计的蒙汉机器翻译实验系统。通过对蒙文复合词的切分、对翻译词典进行扩展等方法,提高了系统的性能。实验结果表明,在双语对齐语料极其缺乏的情况下,该实验系统的初步建立是成功的,翻译结果是合理的,相对传统的机器翻译系统智能性有所提高。
其他文献
每每出现严重事故,公众谴责如潮,要求严惩祸首,都表明海事安全是不容妥协的。现在的人们,至少是产业界的人们,愿意相信这样一种观点:事故都是可以防范的,而出了事故是不能原谅
以大黄、蓖麻、独角莲、博落回四种植物提取物为材料,探索其对人参四种真菌病害的抑菌活性,并对其中的大黄、蓖麻提取液的对人参病菌的防治效果以及理化性质进行了进一步研究。
连城县素有“中国红心地瓜干之乡”的美称。改革开放以来尤其是加入WTO后,连城地瓜干产业发展迅速,地瓜干不仅畅销国内33个省、市、自治区,而且还远销日本和东南亚各国,享誉海内
贫困是世界所有国家,包括发达国家和发展中国家的共同难题,是社会动荡和经济波动的重要根源,因此一直是各国政府和学术界共同关注的重要领域。中国是发展中国家,底子薄、人口多、
长期以来,人们普遍认为词汇在语言中处于核心位置。词汇的学习一直是外语学习者最为关心的问题,词汇量的大小直接影响到学习者的听、说、读、写四项基本技能的发展,因而外语教师
本文通过对北京郊区的小城镇进行抽样调查,研究总结了京郊小城镇的环境艺术现状、存在的问题,并指出了发展的方向。京郊小城镇的环境艺术设计有很多优秀典型,但也存在许多不足,今
可持续发展战略是当今包括中国在内的许多国家的基本发展战略。任何战略都是需要行动主体来具体付诸实施的。对于可持续发展战略来讲,这个实施主体就是可持续发展的社会行动系
针对传统单工位装配序列求解上的不足,将粒子群算法应用于多工位多目标装配序列优化的求解,提出一种面向复杂多工位产品的装配序列优化方法。采用优先序列图(Assembly precede
高层管理团队承担着制订和实施企业战略的使命,对企业绩效和组织发展至关重要,也一直是学者们和企业经理重点关注的研究主题。已有的关于高层管理团队异质性与企业绩效关系的