【摘 要】
:
神经机器翻译在高资源情况下已经获得了巨大的成功,但是对低资源情况翻译效果还有待提高.目前,维吾尔语-汉语(维汉)翻译和蒙古语-汉语(蒙汉)翻译都属于低资源情况下的翻译任
【机 构】
:
中国科学院新疆理化技术研究所,中国科学院大学计算机科学与技术学院,新疆民族语音语言信息处理实验室
【基金项目】
:
国家自然科学基金(U1703133),新疆自治区高层次人才引进工程项目(Y839031201),新疆维吾尔自治区重点实验室开放课题(2018D04018)。
论文部分内容阅读
神经机器翻译在高资源情况下已经获得了巨大的成功,但是对低资源情况翻译效果还有待提高.目前,维吾尔语-汉语(维汉)翻译和蒙古语-汉语(蒙汉)翻译都属于低资源情况下的翻译任务.本文提出将汉语单语数据按照领域相似性划分成多份单语数据,并通过回译方法分段利用不同的单语数据训练翻译模型,然后借助模型平均和模型集成等方法进一步提升维汉和蒙汉翻译质量.使用第16届全国机器翻译大会(CCMT 2020)的评测数据进行实验,结果表明该方法可以有效地提升维汉和蒙汉翻译的翻译质量.
其他文献
写作一直是初中英语教学中的一个重难点,由于大多数初中学生缺乏语言组织能力和英语表达能力,在日常的写作中,这些弊端都会被充分地体现出来.因此,作为英语教师应该注重提高
为充分研究预约停车位设置方法对路内停车巡航时间的影响,根据深度优先搜索(depth first search,DFS)算法设计了停车寻位的流程、设计仿真运行程序以及仿真的一般场景,提出了
为了解决汉英平行语料中带噪声的问题,通过设计规则方法、统计方法(包括Zipporah系统、词对齐模型、语言模型)以及神经网络方法(包括翻译模型和双语预训练模型),从不同侧重点
[背景]金黄色葡萄球菌作为一种条件致病菌,在临床感染中扮演着重要的角色,需要研究更多更有效的防治手段.[目的]分离金黄色葡萄球菌噬菌体,研究其生物学特性,从而为金黄色葡
空中纺线(AS)法主缆纺丝时,钢丝通过绕过锚靴进行锚固,锚靴的半径通常较小,此时钢丝会产生较大的弯曲应力.为了对锚靴位置钢丝的受力安全性能进行分析,首先,采用单根无应力钢
化学作为高中教育阶段的重点科目之一,对于训练学生理科思维、提升学生自主学习能力作用显著.在本文中,笔者将联系实际的高中化学教学和在学生中开展工作的反思体会,分析一下
识字是小学生学习文化的起点,是他们接触语文这门学科的基石.中国汉字在其历史之上有着几千年的文化,其博大精深.而且目前我国人均语文水平和文化程度都极高.因此,根据教育部
语言表达是学生在语文学习过程中应该具备的一种能力.表达能力不仅是学生语文学习能力的体现,同时也能影响到学生的各科学习效率以及性格发展.语言表达能力除了善于言谈之外,
针对钢桥病害识别效率低、精度不高的现状,提出了一种基于深度学习的钢结构表观病害识别方法。该方法将卷积神经网络Inception-v4和迁移学习相结合,分别采用迁移学习中特征提取和微调2种训练方式获得2种模型,并与全新训练的Inception-v4模型进行对比。首先,收集656幅钢桥病害图像,包括涂层劣化176幅,腐蚀173幅,焊缝开裂151幅,完好156幅,对其进行旋转、翻转、调整对比度等预处理,
在新的基础教育课程改革不断推进、不断深入的过程中,初中语文教学在教学模式、教学方案、教学目的等多个方面都发生了巨大的改变.现阶段的初中语文教学更加重视学生的基础素