神经机器翻译网络结构建模研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:hncdbf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的快速发展,以神经网络为基础结构的神经机器翻译取得重大突破,在翻译质量上几乎全面超越了传统的统计机器翻译。神经机器翻译主要基于“编码器-解码器”框架对翻译过程进行建模,并采用注意机制建立互译词之间的对应关系。在这一框架下,如何建立更优的网络结构以进一步促进源句子语义信息的提取和转换受到众多科研人员的追捧和青睐。本文主要针对神经机器翻译中的三大主要模块(即:编码器、注意机制和解码器)提出相应的网络结构增强方法,在提升系统建模能力的同时增强系统的翻译性能。本文的主要工作如下:1、提出一种上下文感知的循环编码器模型。已有循环编码器采用双向循环神经网络来建模源句子,并且简单地将不同方向循环网络的表示进行拼接作为源端词的语义表示。这种建模方法隐式地假设了不同方向上上下文信息间的独立性,不利于源句子语义信息的精准提取。本文提出一种上下文感知的循环编码器模型,通过设计层次化的网络结构将不同方向上的上下文信息进行整合,融入到统一的句子表示之中。大规模NIST中文到英文和WMT英文到德文的实验结果表明本文提出的方法可以显著地改善翻译系统的译文质量,并有效地加快了系统的解码速度。2、提出一种基于循环神经网络的注意机制模型。当前注意机制通常赋予每个源端词一个权重,然后采用线性加权和的方式来提取与翻译相关的语义信息。然而,这一模型本身是线性的,往往很难建模源词之间复杂的内部依赖关系以及源词和目标词之间多样的翻译关系,尤其不利于长句子的翻译。本文提出一种基于循环神经网络的注意机制模型,借助循环神经网络中门的结构来动态地探测与翻译相关的源端语义,并利用其内部复杂的非线性网络结构来更好地学习不同语言间的语义对应关系。实验结果表明,本文提出的方法可以显著地提升翻译系统的性能,并且在长句子的翻译上表现非常出色。3、提出一种基于隐变量的变分解码器模型。现有解码器大多是判别式的,只能利用源端的语义信息进行翻译。但是,同一个源句子往往存在多种风格不同、用词迥异却忠实而流利的标准译文,这些仅仅依靠源端信息是无法充分确定的。本文研究如何在解码过程中融入目标端句子的信息,并提出一种生成式的解码模型。通过将目标端句子的信息融入到隐变量的后验分布,并借助变分算法学习与后验相近的先验分布,解码器可以充分利用隐变量先验分布中蕴含的目标端信息。在NIST中文到英文和WMT英文到德文的翻译任务上,实验结果表明引入目标端的信息可以显著地增强系统的翻译能力,并有效地减少漏译和错译等问题。本文旨在研究如何设计全新的神经网络结构来增强神经机器翻译的建模能力。针对翻译系统中的三大模块:编码器、注意机制和解码器,本文分别提出了上下文感知的循环编码器模型、基于循环神经网络的注意机制模型和基于隐变量的变分解码器模型,并取得了令人满意的效果。
其他文献
商业银行跨界电商已是大势所趋,面对传统电商的先发优势,商业银行要打造接受度高的电商平台,首先要解决的是定位问题,即B2B是银行系电商平台的战略选择。近年来,随着互联网行
为了能够尽早发现滚动轴承开始出现显著退化的临界状态,精准预测滚动轴承的状态退化趋势,提出了T-分布随机近邻嵌入(T-SNE)样本熵状态退化特征指标和基于时间卷积网络(TCN)的
随着时代的发展,科技的进步,信息网络系统已开始成为国家和社会生活运行的一条重要生命线,随着政府上网工程大规模发展,一个开放、高效、完善的电子政府在新世纪的中国逐渐出
1998年8月~1999年12月,我们共收治功能性消化不良(以下简称FD)患者124例,分别予舒胃汤及西沙比利治疗,并观察胃动素、胃电图等指标,现报告如下。
20世纪80年代初我去德国学习。学习之余,我的最大爱好是瞻仰名人故居。在走访位于特利尔的马克思故居后,我又有幸在波恩参观了有“世界乐圣”之称的贝多芬的故居,并踏入了诞生贝
“数字集成电路设计与验证”是一门微电子方向研究生重要的学科基础课,具有很强的工程实践性。如何让学生全面掌握整个数字集成电路设计流程及设计方法并具备分析和解决问题
<正>世界最大海上风电场在英国正式启用英国能源部大臣Edward Davey于2012年2月9日出席了位于英国坎布里亚海岸附近爱尔兰海域的沃尔尼海上风力发电场项目启用仪式。该项目由
以木屑为填料,采用多层生物滤塔净化H2S气体,研究其适宜的工艺条件及生物降解宏观动力学。结果表明,填料分层可提高H2S去除率,当进气容积负荷<153.2 g H2S/(m3.d)时,H2S的去
目的对城市不同血糖状态中老年女性学习新事物能力进行调查研究。方法所有调查对象均经过空腹血糖与餐后血糖两次血糖监测,血糖状态确定采用美国ADA2003标准,调查问卷采用世界
镉胁迫使萝卜幼苗超氧阴离子(O2^-)、过氧化氢(H2O2)和丙二醛(MDA)含量增加;随着镉浓度提高,超氧化物歧化酶(SOD)活性首先明显上升,然后逐渐下降,甚至低于对照:叶片过氧化氢酶(CAT