利用质量估计改进无监督神经机器翻译

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:hbimac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统上神经机器翻译依赖于大规模双语平行语料,而无监督神经机器翻译的方法避免了神经机器翻译对大量双语平行语料的过度依赖,更适合低资源语言或领域。无监督神经机器翻译训练时会产生伪平行数据,这些伪平行数据质量对机器翻译最终质量起到了决定性的作用。因此,该文提出利用质量估计的无监督神经机器翻译模型,通过在反向翻译的过程中使用质量估计对生成的伪平行数据评分,再选择评分(HTER)较高的平行数据训练神经网络。利用质量估计的方法可以控制反向翻译生成的伪平行数据的质量,为对抗生成网络提供了更丰富的训练样本,使对抗生成网络
其他文献
循环流化床锅炉作为高效清洁燃烧技术,具有广泛的应用前景,但磨损泄漏一直是困扰循环流化床锅炉长周期运行的一大技术难题.燕山石化DG410/12.7-Ⅱ1循环流化床锅炉于2014年投
通过分析伺服驱动辊锻机的工作原理和结构特点,用建模软件搭建三维模型,采用整体施加载荷、各零件单独分析的静力学分析方法,利用仿真软件模拟250 mm伺服驱动辊锻机整体模型
神经机器翻译在平行语料充足的任务中能取得很好的效果,然而对于资源稀缺型语种的翻译任务则往往效果不佳。汉语和越南语之间没有大规模的平行语料库,在这项翻译任务中,该文
以北部湾盆地涠西南凹陷W区流沙港组为例,结合沉积微相研究和砂体对比,利用密井网资料分析建立了正常三角洲和辫状河三角洲沉积储层定量地质知识库.根据岩性、沉积构造、特殊
以石油化工催化剂高温立式焙烧炉为例,介绍了高温立式焙烧炉的过滤器、过滤筛板和旋风分离器关键部件的优化改造.其中,过滤器保留原来的填料区结构以吸收立式焙烧炉顶部回流
近日,内蒙古博洋广告成功并购赤峰市诚信单位——赤峰市烽火台科技有限公司,并正式控股接管。之后,博洋将为赤峰市3200余辆出租车逐步安装GPRS导航系统,为出租车及人员的安全
从专利角度对石科院MIP系列技术中的工艺专利保护情况进行分析,分别围绕MIP工艺、MIP-CGP工艺、MIP-LTG工艺和MIP-DCR工艺的进料方式、催化剂控制、反应条件控制及反应器类型
国际商务谈判与双方的利益休戚相关,使用模糊语是谈判双方为了各自的目的和意图而做出的有意识的选择。国际商务谈判中对模糊语的恰当使用可以有效增强谈判者的表达效果,通过
虽然重庆市境内天然气资源丰富,是我国第一个页岩气规模化生产地区,但由于页岩气勘探开发项目产量不确定性高、单井投资大、补贴前景不明朗等客观条件,并伴随着页岩气勘探开
医疗问题诉求分类属于文本分类,是自然语言处理中的基础任务。该文提出一种基于强化学习的方法对医疗问题诉求进行分类。首先,通过强化学习自动识别出医疗问题中的关键词,并