【摘 要】
:
随着神经网络的飞速发展,机器翻译有了巨大的突破和进步,为了告知用户机器译文的可靠性,提出了译文质量估计方法。译文质量估计技术是指在无需参考译文的情况下对机器译文进行自动评估的一种方法。译文质量估计的发展从基于机器学习到基于深度神经网络,近年来预训练语言模型的出现给译文质量估计技术开辟了新的道路。本文基于XLM-R预训练模型构造译文质量估计模型,研究工作概括如下。针对译文质量估计在使用预训练模型时只
论文部分内容阅读
随着神经网络的飞速发展,机器翻译有了巨大的突破和进步,为了告知用户机器译文的可靠性,提出了译文质量估计方法。译文质量估计技术是指在无需参考译文的情况下对机器译文进行自动评估的一种方法。译文质量估计的发展从基于机器学习到基于深度神经网络,近年来预训练语言模型的出现给译文质量估计技术开辟了新的道路。本文基于XLM-R预训练模型构造译文质量估计模型,研究工作概括如下。针对译文质量估计在使用预训练模型时只依靠了CLS位进行直接预测的情况,本文提出了加入注意力机制和门控机制来融合预训练模型两个输出的方法来进一步增强句子的语义信息,这样在句子级质量估计中可以更多关注到关键单词的信息。针对译文质量估计语料缺少,模型在训练时容易造成过拟合问题本文提出了三种构建伪语料的方法。同时针对译文质量估计模型在训练过程并没有利用后编辑译文的情况,本文提出将后编辑译文引入模型训练,采用两个XLM-R模型进行向量交互的模型结构自动学习机器译文与后编辑译文的关系,在测试时,构造伪后编辑译文信息作为辅助来预测译文质量。以上方法都在CCMT2021和WMT2020两个数据集上进行了实验,实验结果均得到了提升。最后,设计并实现了基于XLM-R预训练模型的译文质量估计系统,该系统属于一个测试系统,可以直接进行句子级和词级的质量估计,同时可以实现最佳译文的推荐。
其他文献
研究背景心力衰竭是由各种心脏结构和功能性疾病导致心脏充盈和/或射血功能受损,心脏排血量不能满足机体组织代谢需要,引起肺循环或者体循环淤血,器官组织血液灌注不足为临床表现的一组综合征。在过去的20年里,心力衰竭的药物治疗和器械治疗显著改善了低射血分数心力衰竭患者的症状并延缓了心衰进展,但这些患者的总体预后仍然相对较差,5年内死亡率接近50%,因此,新途径的识别和对潜在治疗靶点的有效干预可能减缓心衰疾
第一部分 血清25(OH)-D不同缺乏程度在特发性BPPV成因、疗效、预后中的作用探讨背景:眩晕是目前老年人群中致残率最高的一种病因,而良性阵发性位置性眩晕(BPPV)是最常见的一种外周性眩晕。尽管BPPV诊断标准明确,治疗方法规范,但复发率高、复位后高达50%的残余眩晕(RD)发生率是目前困扰临床工作者的难题。已证实维生素D(VD)水平低下是复发因素之一,而在RD患者中双温试验(C-Test)异
植物生长发育的本质是基因在不同时期、不同空间的选择性表达引起的生理生化活动以及形态上的变化。该过程由内部遗传基础以及外部环境因素共同调控。植物生长发育由受精卵开始,受精卵经合子激活、极性建立以及器官分化等一系列过程,发育为含有部分组织和器官原基的胚胎。随后在内在发育信号与外界环境信号的共同调控进行胚后发育。本论文运用生理学、细胞生物学、遗传学、分子生物学等手段,探究了4个植物生长发育关键基因的功能
研究背景皮肤创面愈合是皮肤损伤后的一个动态和复杂的过程,受到包括皮肤神经支配在内的各种因素的调节。皮肤神经纤维可以通过直接接触皮肤细胞或间接分泌神经生长因子或神经肽来调节包括皮肤成纤维细胞在内的皮肤细胞功能,从而维持皮肤稳态,调节创面愈合。在皮肤创面愈合过程中,不同种群的真皮成纤维细胞通过发挥包括增殖、分化、收缩、分泌、合成以及重塑细胞外基质在内的多种不同的功能,共同促进创面愈合。研究成纤维细胞功
研究背景Gitelman 综合征(Gitelman syndrome,GS,OMIM:263800)是以低钾血症、低镁血症和低尿钙为特征的常染色体隐性遗传病,同时可能伴有碱中毒和肾素-血管紧张素-醛固酮系统的激活,血压正常甚至偏低,是最常见的遗传性肾小管疾病。其患病率约为1:40000,亚洲人群中患病率略高,约为1:1000。其发病机制为位于16号染色体的SLC12A3发生基因突变,导致其编码的N
马克思立足于人的类本性,完成了对文化本质的揭示。通过横向和纵向两个层面的分析,我们可以得出文化是人类生存方式的历史凝结以及文化交往理论。习近平关于新时代文化建设的重要论述有着深厚的理论渊源,是对马克思对文化本质揭示的继承与创新。探讨马克思对文化本质的揭示及其现实意义,既可以帮助我们更好地理解马克思文化思想的丰富内涵和其在当今时代所具有的独特价值,也有助于从理论维度透视习近平关于新时代文化建设重要论
<正>关键金属是国际上最近提出的资源概念,指的是现今社会必需、但安全供应存在高风险的一类矿产的总称,主要包括稀有金属(如Li、Be、Rb、Cs、Nb、Ta、Zr、Hf、W)、稀土金属(La、Ce、Pr、Nd、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Lu、Sc、Y)、稀散金属(Ga、Ge、Se、Cd、In、Te、Re、Tl)和部分稀贵金属(PGE、Cr、Co等)(侯增谦等,2020).
排气腔体是飞机辅助动力装置(APU)的重要组成部件,在运行过程中会受到排出的高温度高压强的尾气所形成的气流的冲击,进而造成排气腔体损伤,影响APU的运行。因此对APU排气腔体的振动特性进行研究,得到其模态和振型,进而分析排气腔体振动特性,对排气腔体的维修、故障诊断以及结构优化设计都具有重要意义。首先对APU排气腔体进行三维实体建模,再利用ANSYS Workbench的Fluent模块对其进行流场
研究背景纹状体(corpus striatum)是基底神经节最大的结构,由尾状核和豆状核组成,豆状核又分为壳核和苍白球。尾状核和壳核在种系发生上是较新的结构且具有相同的细胞化学构筑,故合称新纹状体(neostriatum),简称纹状体(striatum)。苍白球为旧纹状体(paleostriatum),在种系发生、细胞组成、纤维连接及功能上与新纹状体差异较大,故不作为本课题的研究内容。纹状体也是基