【摘 要】
:
机器翻译的任务是利用计算机将一种自然语言(源语言)的文本自动翻译成另一种自然语言(目标语言)。近年来,随着深度学习技术的突破式发展,神经机器翻译的性能取得了长足进步,成为了主流的翻译方法。翻译记忆是一个存储了专业译员翻译历史的语料库,将翻译记忆与神经机器翻译相融合,为机器翻译模型提供匹配度较高的参考译文作为指导,可以提升神经机器翻译的质量。目前通常采用先检索后翻译的两阶段融合方法,给定待翻译的源语
论文部分内容阅读
机器翻译的任务是利用计算机将一种自然语言(源语言)的文本自动翻译成另一种自然语言(目标语言)。近年来,随着深度学习技术的突破式发展,神经机器翻译的性能取得了长足进步,成为了主流的翻译方法。翻译记忆是一个存储了专业译员翻译历史的语料库,将翻译记忆与神经机器翻译相融合,为机器翻译模型提供匹配度较高的参考译文作为指导,可以提升神经机器翻译的质量。目前通常采用先检索后翻译的两阶段融合方法,给定待翻译的源语句,先从翻译记忆中检索与之最相似的句对,再利用句对中目标端的译文,指导源语句的神经机器翻译。针对现有方法不适用于双语语料缺乏的低资源场景且难以实现参数共享和一体化训练的问题,提出了一种基于跨语言注意力记忆网络的方法,可以实现单语翻译记忆与神经机器翻译模型的融合,且实现检索和翻译过程的一体化训练。实验结果表明,与现有方法相比,该方法取得了更高的翻译质量,且适用于低资源场景。针对现有方法在检索阶段语义相似度计算不够精准和翻译阶段对句法知识利用不足的问题,提出了一种加入预训练语言模型和句法知识的方法,利用预训练模型实现了更好的文本嵌入表示,使相似度计算更加准确,并将源语句的句法信息加入融合翻译记忆后的文本表示,使翻译模型可以在句法层面上更有效地利用翻译记忆。实验结果表明,该方法也可以有效地提升融合效果。
其他文献
健康体检是我国健康中国战略的关键环节,也是居民健康生活的重要保障。随着我国人口老龄化、疫情防控常态化的发展趋势,社区将成为居民生活管理的基础单元,未来也将成为辅助居民就近体检的重要场景。首先明确社区居民体检的相关概述,并对社区居民体检人群、产品分类及现存问题展开分析,明确社区居民体检未来发展方向。其次对社区居民体检相关者就体检中遇见的问题及对体检产品期望进行深入调研,初步梳理社区居民体检需求,运用
满族是我国北方满-通古斯语民族中接触萨满文化较早、所受影响较深、神话留存较丰富、系统相对完整的一支;其万物有灵生命观念引领下的自然神话独特且具有现代意义。满族萨满自然神话的相关史料经学者多年发掘整理趋于深入和完整,迫切需要新形式的解读与再造使其文化内涵焕发光彩。本文根据神话内容玄奥繁杂、载体形式多样的特点,选取代表性满族萨满自然神话,将其载体分为文本与符号分别转译。其中文本载体元素使用母题分析结合
面对百年未有之大变局,国有航空制造企业要想在激烈的市场竞争中得以生存和发展,必然要对自身的经营管理水平提出更为严格的要求。科学合理的绩效管理是企业提高经营效率的基础。良好的绩效管理不仅可以促进管理者与职工在企业发展愿景上达成共识,为实现组织目标,不断创新企业的管理、技术及服务,而且可以提高企业的管理质量、提升产品市场占有率。A飞机制造公司隶属于大型国有航空制造企业,其绩效管理存在如下问题:绩效管理
污泥产量的快速增长使其处理处置成为当前亟待解决的问题。由于污泥中含有丰富的蛋白质,将其资源化回收并利用将具有很大的发展空间。本文重点考察了不同沉淀方法和腐殖酸处理对污泥蛋白质结构及性质的影响。结果表明:(1)低温热碱法最优工况为:碱的添加量为30%、反应温度为80℃和反应时间为2 h,此时蛋白质提取效率为69.44%;(2)在不同沉淀法中,能显著的沉淀分离蛋白质的主导因素有pH为4.0、乙醇浓度为
萨满图腾文化体现了中华优秀传统文化中“道法自然、天人合一”的思想理念,以及“形神兼备、情景交融”的美学追求,本研究秉持客观、科学、礼敬的态度,坚持“创造性转化、创新性发展”的指导思想和基本原则,取其精华、去其糟粕,扬弃继承,转化创新,深入探讨其中的“中国风元素”,通过外在的显性因子感知内在的文化内涵,分析其共性规律,再通过设计转化,为它赋予新的时代内涵和表达形式。课题以萨满图腾元素为研究的切入点,
随着航空工业的迅猛发展,型材应用日益广泛。在生产中,型材零件的尺寸和特征位置往往需要检验,所以对型材检验模具的需求迅速增加。设计人员设计型材检验模具时,通常需要繁琐的手工频繁和经验判断去完成。在检验块绘制时,检验块尺寸位置要参考型材下陷和漏水孔特征,当上述特征较多时,需要人为地反复检查。这就造成了模具设计周期过长,效率较低的情况。因此,论文基于CATIA二次开发技术,研究如何对型材检验模具进行智能
目前,铝/钢复合结构已应用于航空航天、汽车和船舶等制造业。然而,两种材料间较大的物化性能差异使得铝/钢接头的可焊性较差。搅拌摩擦搭接焊(Friction stir lap welding,FSLW)因焊接温度低在铝/钢异材焊接方面具有优势。对于铝上钢下的搭接配置,本课题基于搅拌针微扎透钢表面的思想进行2024铝/304不锈钢的FSLW试验,分析不同焊接参数下的接头连接质量,揭示超声和镍(Ni)中间
未经妥善处理的污泥排放后会对自然生态环境造成严重危害,需采用环境友好的手段对其处理。本文用污泥与菱镁尾矿为原料协同煤矸石制备高强度轻质陶粒骨料。基于对三种工业固废的基本特性的研究以及热力学特性分析的结果,通过改变原料配比、预热温度、预热时间、烧结温度与烧结时间来研究不同烧制工况对陶粒材料性能产生的影响,通过正交实验探究最佳陶粒制备工况,最后对陶粒成品进行重金属固化特性以及环境安全特性的分析评价。对
聚类算法作为无监督学习的代表算法被广泛应用于数据挖掘领域。传统聚类算法如划分聚类、层次聚类、密度聚类等在大数据时代对高维数据进行聚类时,聚类的时效性、准确性都不能很好的满足人们的要求,随着量子机器学习的不断发展,许多学者结合量子计算与传统聚类算法提出了新型量子聚类算法并取得了较大的进展。基于目前量子聚类算法研究现状,本文首先对量子聚类算法进行了分类,根据分析结果,重点针对k-medians和最小生