基于伪数据的机器翻译质量估计模型的训练

来源 :北京大学学报(自然科学版) | 被引量 : 0次 | 上传用户:senjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为向基于深度学习的机器翻译质量估计模型提供高效的训练数据,提出面向目标数据集的伪数据构造方法,采用基于伪数据预训练与模型精调相结合的两阶段模型训练方法对模型进行训练,并针对不同伪数据规模设计实验。结果表明,在构造得到的伪数据下,利用两阶段训练方法训练得到的机器翻译质量估计模型给出的得分与人工评分的相关性有显著的提升。
其他文献
0TN技术具备WDM、SDH两种技术之优势,可有效满足传送网对容量、带宽以及安全和质量的要求,该技术必将成为未来通信技术的发展主流趋势。文章先对OTN技术的内容、特点进行分析
本文研究了人工诱导麦穗鱼亲鱼性腺同步发育,雌鱼试验组的性腺指数明显大于对照组,已经达到了9.2±1.5a,而对照组为6.3±1.1b;雄鱼试验组的性腺指数明显大于对照组,
2013年12月初,国家知识产权局正式受理由安徽省宣城市渔业局高级工程师周洵和郎溪县水产站高级工程师陈冬林领衔研发的“水中环保卫士——麦穗鱼”系列发明专利。自2010年开
介绍了10万m3及以上容量浮顶油罐开孔及补强情况,就目前JB/T4736-2002《补强圈》和GB150--1998《钢制压力容器》中对补强的限制以及SH3046-1992《石油化工立式圆筒形钢制焊接储
伴随着我国整体社会水平的不断提高,我国草原畜牧业同时也面临着十分严峻的挑战与机遇。把握草原畜牧业的发展方向及模式将直接影响到我国草原地区的经济与生活水平,同时对我
目的探索氨氯地平阿托伐他汀钙片治疗高血压合并冠心病的疗效。方法选取2017年2月13日至2018年2月13日期间我院高血压合并冠心病100例患者(实施信封随机分组模式),对照组的50
现如今,伴随着新课改的不断深入,我们国家的教育模式也在不断变化,相关部门开始越来越重视学校对全能型人才的培养。而数形结合思想恰好是数学课堂教学中的重要思想,并且还可
目的探索氨氯地平阿托伐他汀钙片治疗高血压合并冠心病临床疗效。方法高血压合并冠心病患者118例,进行随机均分成对照组和观察组。观察组59例采用氨氯地平阿托伐他汀钙片进行
本文结合语音调查和分析,归纳分析了初级汉语水平的韩国留学生在学习汉语声母、韵母、声调方面存在的重难点音,在此基础上,提出了针对他们进行发音方式展示的技巧和方法,希望
本文介绍了典型地铁车站的火灾自动报警系统(FAS)设备组成,采用哪些FAS硬件和软件设备搭建的FAS实验平台,以及搭建完成后的实验平台在实际中的应用,并尽可能促进其应用。