机器翻译中的模型学习问题研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:jp19861213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入信息时代,日益频繁的跨语言交流极大地增加了人们对于语言翻译的需求,而传统的人工翻译已无法满足当前的翻译需求,机器翻译技术成为了人们应对当前巨大翻译需求的有效手段。在诸多的机器翻译研究方法中,基于数据驱动的统计机器翻译和神经网络机器翻译因其良好的学习能力和较好的翻译效果得到了广泛的应用。模型学习是基于数据驱动的翻译方法的基础性问题,模型的好坏决定了机器翻译系统能否充分地刻画语料中的翻译知识,并最终决定了翻译系统能否有效地完成翻译任务。统计机器翻译模型中,由于采用了对数线性模型框架,使得其具有易于融入多样性特征的能力。然而,基于对数线性模型框架的统计机器翻译在模型学习方面依然面临若干重要的问题,其中一个问题是,现有的对数线性模型的判别式参数训练方法通常将训练问题分解为翻译候选对的排序问题,无法利用到整个翻译候选列表的全局序信息,从而影响模型参数训练的效果。另一个问题是,对数线性模型框架基于模型得分和特征间的线性相关假设通过线性方式组合特征建模翻译,无法深度刻画特征的潜在信息并且缺乏判别能力。在神经网络机器翻译模型中,当前的模型通常仅仅基于字或者词级别的表示来学习句子表示并以此建模翻译问题,难以有效地利用在统计机器翻译中已经证明有效的多粒度信息和短语、句法等结构信息,进而无法充分地对句子的层次结构信息和结构化的上下文信息进行刻画和利用。本文针对上述问题展开对机器翻译中的模型学习问题的研究,主要工作包括:1.提出了一种基于翻译候选列表排序优化的统计机器翻译的参数学习算法。针对当前统计机器翻译中判别式参数学习方法无法利用翻译候选列表全局信息的问题,该方法直接建模列表的排序,更好地拟合了列表样本,避免了将列表排序分解为翻译对排序所造成的信息损失。在此基础上,本文还提出了顶序增强的损失函数,使训练目标更加关注于包含更多信息量的高质量译文的排序错误。实验结果表明,本文提出的基于列表排序优化的学习框架和顶序增强的损失都能够显著改善翻译译文的质量。2.提出了一种基于非线性框架的统计机器翻译模型。该模型通过神经网络自动学习特征的表示和组合关系,允许特征之间存在更加复杂的交互关系,从而能够更好地表示潜在的特征信息和增强模型对优劣翻译的判别能力。同时,本文也研究了启发式网络结构设计和自主网络结构学习的方法,增强了神经网络模型的学习能力。实验表明,随着模型的表达能力和判别能力的提升,翻译系统的翻译结果也得到了显著的提升。3.提出了一种融合多粒度信息的神经网络机器翻译模型。为了能够利用不同粒度的信息(字、子词和词等)进行翻译建模,首先,本文提出了带字注意力机制的编码器,通过字级别的信息来增强源端的词和子词级别的表示学习;其次,本文还提出了多级注意力机制的解码器,使得字和词的信息能够协同控制目标端的译文生成。实验表明,本文提出的方法有效地提高了机器翻译模型的翻译质量。4.提出了一种句法结构增强的神经网络机器翻译模型。为了将句子的句法结构信息引入到翻译过程中,本文基于神经网络翻译模型,提出了显式融合源端句法树信息的编码器-解码器框架,设计了双向树编码器机制用以同步学习序列化和句法结构的上下文信息;同时,本文还设计了一个树覆盖度机制以利用源端树结构控制译文生成。实验表明明,引入句子结构信息极大地改善了机器翻译的质量。
其他文献
二氧化碳膨胀爆破技术不仅是工程爆破的一项补充,也是一项有广阔发展前景的技术。中国爆破行业协会及管理部门高度重视及支持该项技术的发展,近年理论和技术研究均取得很好成
知足、知不足、不知足,这是一个人应有的态度,应有的觉悟,应有的境界。知足,就是要知足常乐。哲学家、思想家老子曾说:祸莫人于不知足,咎莫大于欲得,故知足之足常足矣。诚然,当今社会
轨道交通高等减振和特殊减振措施均具有良好的减振效果,在城市轨道交通中被广泛使用。为了解高等减振和特殊减振措施下车内不同位置的振动特性及其对乘客产生的影响,引入建筑
就住宅室内照明艺术来说,任何漂亮、幽雅的房间和陈设,没有光则是一片昏暗.有了光,室内协调的色调,新颖的家具、美丽的装饰才能被表现出来,人才开始感觉到一切,才可以进行正
基于SPOC的"翻转课堂"教学是信息技术与课程教学深度融合的产物,是教学内容的重构与教学流程的再造,是"互联网+"时代教学模式的革命性变革.广州大学"中国近现代史纲要"课程"
通过对CO2爆破原理和施工工艺的分析,总结了多年CO2爆破施工经验,结合安全技术分析,对CO2爆破激发管运输、致裂管运输使用、爆破施工现场等安全薄弱环节进行预防和管控,不断
某番鸭养殖场2周龄肉鸭发生以腹泻、呼吸困难及软脚为主要症状的疾病,鸭群整体精神沉郁,耗料量下降,结合流行病学调查、剖检病理变化等初步诊断为番鸭细小病毒(MDPV)感染。为
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
首先通过开展实态调研,明确残障老年人的生活状态、居住环境现状及其对现有居住环境的主观评价,归纳出套内空间生活困难点项目;其次根据肢体残障者、视力残障者和智力障碍者3