基于跨语言预训练的零样本神经机器翻译研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zhaocd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济全球化的深入,各民族之间的文化交流日趋频繁,人们对于机器翻译的需求也不断增大。目前,基于深度学习的神经机器翻译因其优异的翻译性能,已经成为了机器翻译的主流方法并在工业界得到了大规模应用。然而,神经机器翻译属于数据驱动的技术,在训练过程中需要大量的平行句对来对模型参数进行优化。因此,很多低资源语向的机器翻译效果并不令人满意。本文的研究对象为零样本神经机器翻译。零样本机器翻译是指源语言与目标语言在训练过程中不存在平行句对。零样本机器翻译作为低资源机器翻译的一种特殊情况,更具挑战与前景。在本文中,我们尝试从拉近各源语言的语义空间的角度来提高零样本神经机器翻译质量。我们提出了一个基于跨语言预训练的零样本迁移算法框架,该框架的核心在于利用跨语言预训练方法将不同源语言映射到同一空间,从而实现语种的迁移。通过该统一框架,我们将零样本翻译问题转化为了跨语言预训练问题,而跨语言预训练模型的质量直接影响到了零样本的翻译质量。为了能够从不同种类型的训练语料中学习到跨语言知识,我们分别提出了基于单语语料的预训练、基于双语句对的预训练和基于双语词典的预训练方法。首先,我们分析了当前一些主流方法(基于迁移的神经机器翻译和多语言神经机器翻译)在零样本翻译上失效的原因,进而提出了一个两阶段的零样本迁移算法框架—先进行跨语言预训练再进行神经机器翻译训练。我们通过实验验证了该框架的有效性。其次,我们针对目前主流跨语言预训练方法不能有效地利用标注数据中监督信号的问题,提出了多种基于平行句对的双语跨语言预训练方法。从句义相等的角度出发,我们提出了基于语义不变性的约束、基于对比损失的约束和基于对抗损失的约束训练方法。从词级别对齐的角度出发,我们提出了块掩码机制、利用外部工具指导模型对齐和利用网络自适应对齐的方法,来迫使预训练模型输出更强的语言无关的向量特征。最后,针对某些极端低资源的孤立语系,我们提出了基于双语词典的跨语言预训练方法。该方法使用真实词典或推导出的双语词典来将单语语料中的词语进行替换,进行跨语言预训练。利用该方法得到的模型来初始化无监督翻译系统,能够大大提升无监督翻译系统的性能,从而提升这些孤立语系的翻译质量。
其他文献
衍射成像技术是实现大口径空间望远镜系统的有效途径之一,相较于传统的折反射元件,衍射成像元件因其面密度低、面型公差宽松等特点,可作为衍射望远镜系统中大口径的主镜。随着衍射成像技术的迅速发展,衍射成像主镜口径的扩展已成为重要的发展趋势之一。故本论文围绕扩大衍射成像元件口径这一问题,针对全息透镜这类衍射成像元件,提出了一种全息曝光拼接的方案来增大全息透镜的口径。主要的研究内容如下:1.介绍了空间望远镜的
学位
减损规则起源于英美法,旨在对非违约方的损害赔偿进行限制。本次《民法典》制定中保留了原《合同法》第119条,将减损规则规定于第591条,并未做太大改变,几乎保留全部条文。由于法律条文规定均采用“适当措施”等不确定概念,在司法实践中需要法官结合案情进行具体化适用,这就给法官自由裁判留下了空间,不利于统一裁判尺度。因此,对于减损规则有必要进行进一步探讨。第一部分,首先从减损规则的理论基础入手,确定诚实信
学位
应诉管辖制度本质上是协议管辖。依据该制度,无管辖权的法院因被告应诉而合法取得了管辖权。许多国家都在立法或者判例中确立应诉管辖为重要管辖依据之一。尽管应诉管辖已经成为国际民诉中通行的管辖权依据,但不同国家对应诉管辖的定义以及认定存在诸多不同。无论是在原审法院建立管辖权阶段,还是在外国法院对判决的承认与执行阶段,都存在对应诉管辖的准确认定问题。应诉管辖是否能够构成,主要考察被告的行为,但具体如何解读,
学位
随着互联网信息技术及数字经济的迅猛发展,扫码支付、扫码乘车等智能化场景及产品在经济生活中的不断普及,人们对传统现金类、票据类自助设备需求阶段性降低,对于相关自助设备维保服务企业向上发展带来一定影响。广电银通作为国内最大的ATM、AFC等相关自助设备维保服务商,依拖母公司广电运通智能制造的支持,同时基于宏观的消费升级、服务升级、国产化等趋势的影响,新的需求也不断催生,因此,银通公司维保服务质量再提升
学位
增材制造可以实现砂轮磨料层的三维结构化,提高砂轮容屑空间与冷却效率,降低磨削力和磨削温度,提高工件的磨削质量,同时可以提高砂轮结构的使用寿命。本文从磨削加工的角度探索结构化金刚石砂轮的设计理论,基于磨削力稳定性与冷却作用一致性构建砂轮结构的设计原则,开展金刚石砂轮选区激光熔化(Selective Laser Melting,SLM)成型特征与质量优化的研究,研究SLM工艺参数对金刚石砂轮成型特征的
学位
晚清是中国原创科幻小说的起源时代,科幻小说作为来自西方的舶来品移植到晚清中国的土壤,引发了中国本土科幻小说翻译与创作之盛行。晚清科幻小说负载了萌芽状态的科学意识与启蒙价值,记录了近代知识分子对新学与现代化的渴望。乌托邦想象是晚清科幻小说中的重要特征与建构对象。本文将从乌托邦书写角度出发,分三章探讨晚清科幻小说中的乌托邦思想与现代叙事。第一章主要阐释晚清科幻小说的现代转型背景,包括西学东渐下科学新知
学位
卡特福德的翻译转换理论系统地分析了不同语言在不同层次之间发生的翻译转换。卡特福德的理论侧重于语义的对等而非形式的一致,这与信息类文本中“内容重于形式”的翻译策略相符合,因此,本文选用该理论来指导翻译实践并进行译文分析。而翻译的过程和结果也证实了该选择的正确性。在笔者进行翻译的过程中,翻译转换这一手段是笔者最常用的方法之一,其对实现文章整体的逻辑性要求也十分必要。从翻译结果的角度上看,卡特福德翻译转
学位
光学操纵由于其无机械损伤的特点在生物医学微芯片中的应用较为广泛,可实现细胞培养、捕获、分选和检测等功能。采用COMSOL Multiphysics仿真分析软件,利用光学操纵,在微通道结构中,模拟细胞群随鞘流的流动并分析细胞受激光力后的运动过程。选用聚苯乙烯微球进行鞘流实验,在100mw激光器的作用下,观察粒子在微流控芯片中的运动情况。结果表明,细胞在鞘流中的偏转受其物理尺寸和激光功率的影响。同时聚
期刊
癌症是一类源于遗传和表观遗传改变的疾病。然而,由于肿瘤细胞和分子标志物的数量少,在癌前和早期阶段对癌症的检测是有限的。越来越多的纳米药物递释系统(NDDS)已经被研究用于肿瘤治疗。这些纳米粒子可以通过增强渗透和滞留效应(EPR)被动靶向至癌变部位,然而,被动肿瘤靶向给药系统的治疗效果远非最佳,并且不能满足日益增长的现代医学需求。因此,迫切需要开发新型给药系统,以实现治疗药物靶向给药。本文旨在以具有
学位
随着新能源技术的推广,能高效利用各类能源、兼容过往技术的交直流混合微电网技术得到了快速发展。连接交直流电网的AC/DC变换器是混合微电网的重要组成部分。高效率、低成本、小体积、稳输出是变换器研究上始终追寻的目标,三相AC/DC变换器拓扑结构以及控制策略仍有待发展。同时,随着材料技术的发展,功率半导体器件也进入宽禁带时代,各种高性能的第三代器件开始挑战传统硅基器件的主导地位。结合应用需求以及新器件的
学位