基于错误驱动学习的机器翻译后编辑建模

被引量 : 0次 | 上传用户:IT_Yong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有机器翻译引擎依然远远满足不了用户的需求,用户往往需要对机器译文进行大量的重复性的错误修正,而机器译文中这种重复性错误的修正会消耗用户大量的时间而降低用户体验。为此,不少研究就机器译文自动后编辑进行了相关工作。但是,主流的后编辑方法是基于统计机器翻译(SMT)的后编辑,而SMT的不透明性为研究机器译文不足带来了困难。在这种背景下,本文引入错误驱动学习机制,分别面向译词错误与词序错误进行后编辑规则学习,从而提高机器译文质量。本文的具体研究内容涉及如下几个方面:(1)面向译词错误的错误驱动学习建模。现有机器引擎给出的译文往往会出现多词、少词、错词的翻译错误,为此,本文在错误驱动学习的框架下,面向译词错误学习增删改后编辑规则。并通过机器译文的质量变化来检验增删改后编辑规则的性能。(2)面向词序错误的错误驱动学习建模。现有机器引擎给出的译文往往会出现词序错误的翻译错误,为此,本文首先通过对齐交叉定义词序错误,并在错误驱动学习的框架下,面向词序错误学习调序后编辑规则。通过机器译文质量的变化来检验调序后编辑规则的性能。(3)基于混合策略的错误驱动学习建模。机器译文错误包含着译词错误与词序错误,为了能够同时解决机器译文中的译词错误与词序错误,我们通过两种策略进行模型级别的融合。首先通过级联式翻译错误驱动学习融合增删改后编辑规则与调序后编辑规则,然后再进行迭代式翻译错误驱动学习。并均在数据集上检验模型的性能。
其他文献
当代的生态批评源于人类和整个地球的生存危机这样一个大背景,旨在探讨文学与自然环境的关系,启发人类意识到人与自然和谐、平衡的重要性。当前的生态运动需要关注的是环境危机
随着社会经济的深化改革及全面建设小康社会工作的稳步推进,我国西南山区的交通建设事业得到迅猛发展,超高墩大跨度桥梁得到广泛应用。近年来工程建设行业生产安全责任事故虽
本刊讯2013年6月13-15日,由中国医院协会主办的静脉输液质量与安全师资培训班第二期在北京举办。中国医院协会李洪山常务副会长兼秘书长、庄一强副秘书长出席。培训由来自美国
会计是一门应用性很强的经济管理学科,所以对会计专业的学生不仅要进行基本理论和基本方法的教学,更要重视专业操作技能的培养,本文就会计专业实践性教学实训中存在的问题与
<正>一、电视剧知识产权本文对电视剧知识产权的探讨主要是针对著作权法中电视剧及相关权益的概念及理解。基于此,笔者认为,电视剧的"著作权"与"版权"可视为同一语。电视剧制
关于加强税务稽查工作的思考敖卫平随着税收征管改革的不断深入,我国的税收工作出现了前所未有的良好局面,税收收入连续多年超额完成国家下达的任务指标,为增加政府财政收入,繁荣
[目的/意义]数字阅读是当前国民阅读的主要途径,付费数字阅读也成为新的消费增长点,但用户满意度仍然不高。文章尝试从用户需求层面进行探究,以期为数字阅读的持续健康发展提
隧洞是水工建筑物中极其重要的结构形式之一,特别是在水利工程的输调水工程中发挥着重要的作用。随着社会主义事业日新月异的发展,人们对隧洞的要求也越来越高。有些隧洞长度要
现代学徒制在我国已经试点两年多了,但是人们对现代学徒制仍然缺乏基本的认识。现代学徒制是在企业职业教育体制下,通过企业真实工作环境中的"在岗培训"这一有效教育形式,专门
为阅读是小学语文教学的重要环节,但农村小学语文阅读教学受认识、学生能力等多方面条件的限制,农村小学语文教学效果低下,不利于学生小学语文阅读的学习。为此,本文针对如何