基于混合策略的汉蒙机器翻译及相关技术研究

被引量 : 29次 | 上传用户:hellogph
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不同的机器翻译方法有各自的优点和局限性。基于混合策略的翻译方法的研究目的就是充分利用各种机器翻译方法的优势,避免每一种翻译方法的不足,达到翻译结果的最优化,从而提高机器翻译系统整体性能。本文在吸收和借鉴以往机器翻译研究的理论与方法的基础上,结合蒙古文信息处理的现状,并充分利用了其相关的资源,研究和实现了基于混合策略的汉蒙机器翻译系统。我们利用已有开源工具搭建了一个基于短语的汉蒙统计机器翻译系统,同时建立了汉蒙机器翻译系统自动评测平台需要的语言资源。我们在该研究中,为了提高基于短语的汉蒙统计机器翻译的性能,本文从以下几个方面进行了研究和实验:(1)通过加入汉蒙双语词典和对蒙古语名词的格、复数及领属等形式附加成分的形态分析,解决了译文中出现的大量未登录词问题。(2)提出了基于蒙古语语序的汉语句子调序方法,解决了基于短语统计机器翻译中出现的大量的语序错误。首先把汉语句子进行句法分析;然后根据调序规则进行调序,让汉语句子的语序尽量接近蒙古语句子的语序;最后把调序后的汉语句子送到统计解码器中进行单调解码。(3)为了解决汉蒙机器翻译中的量词翻译错误,我们对汉语和蒙古语中的量词翻译进行研究的基础上,提出了使用量词表进行翻译,总结出了一对一、多对一、一对零和一对多等汉语量词到蒙古语量词翻译的对应关系,给出了各种对应中的翻译方法。机器翻译的评测对机器翻译技术的研究具有重要的推动作用。在CWMT2009机器翻译评测中,我们为汉蒙日常用语评测任务提供了训练语料,开发集和测试集。为了准备这些语料开发了基于规则的蒙古语句子自动切分程序和蒙古文拉丁转写到UTF-8编码的转换程序,在此,还介绍了研制这些程序的方法与过程。最后,我们给出了基于混合策略汉蒙机器翻译系统的实验及结果分析。
其他文献
累犯制度作为我国现行刑法典规定的一项比较重要的刑罚制度,是对符合一定法律标准的行为人采取较重刑罚处罚的刑罚制度,也是刑法学界今年来着力研究的重点之一。我国早在1979
理性、合法应对行政诉讼是建设"法治消防"的应有之义。在分析新《中华人民共和国行政诉讼法》新变化的基础上,梳理了这些变化对消防执法执勤带来的全新挑战,提出了在当前全面推
在新时代市场经济秩序下,我国房地产行业面临着巨大的机遇与挑战,随着我国房地产行业经济环境的变化,国家有关房地产行业政策也不断调整,本文镍怎么读就主要针对房地产企业税
室内燃气管道系统发生泄漏后,泄漏气体与环境空气不断混合,房间内气体浓度不断变化,达到爆炸极限时遇到点火源容易引发危险事故,近年来由于燃气泄漏引发的爆炸事故时常发生,
为加强全省消防监督执法工作,6月28日,省消防总队在杭州召开了第三次全省消防执法工作例会,朱力平总队长、吴玉根副总队长到会讲话,防火部蒋朝龙部长主持了会议。朱力平总队长在
本文综述了基于结构动态特性相关理论在梁板式结构中的各种模态参数的损伤识别方法,着重强调了应变模态差在损伤识别中的应用。按照振动特点,损伤识别方法可以分为五大类:基于
体操术语是在体操学科领域中的专门用语,是在体操学科本质的规定下,遵循着体操学科发展的客观规律,逐步形成的具有表达学科领域中的准确概念和特定语意的一种特殊的语言形式
任务型语言教学方式是近年来国内外英语教学界都比较提倡的一种教学方式。随着语言研究、语言学习研究、二语习得的不断深入,一方面,任务型教学从这些研究成果中吸收了营养而
实现公共决策的科学化是中国政治文明建设和构建和谐社会的一项基本任务,也是社会主义市场经济发展的内在要求。电子政务有助于推动公共决策科学化的发展,使公共决策更加科学
磨面辊作为面粉生产设备中的主要部件,其耐磨性的好坏将直接影响到面粉质量等级和生产率。目前世界上制粉行业通用的磨面辊材料为白口铸铁,因为白口铸铁中含有大量的游离渗碳