基于句子级BLEU指标挑选数据的半监督神经机器翻译

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:yty3224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在单语语料的使用上,统计机器翻译可通过利用语言模型提高性能,而神经机器翻译很难通过这种方法有效利用单语语料.针对此问题,文中提出基于句子级双语评估替补(BLEU)指标挑选数据的半监督神经网络翻译模型.分别利用统计机器翻译和神经机器翻译模型对无标注数据生成候选翻译,然后通过句子级BLEU指标挑选单语候选翻译,加入到有标注的数据集中进行半监督联合训练.实验表明,文中方法能高效利用无标注的单语语料,在NIST汉英翻译任务上,相比仅使用精标的有标注数据单系统,文中方法BLEU值有所提升.
其他文献
1965年新加坡独立,鉴于当时国际关系的影响和东西方冷战的制约,新加坡采取了追求认同东南亚、认同马来亚、迅速'脱华'的政策.华语虽是新加坡多数民族--华族的母语过,
谢丽华,女,1971年出生,福建仙游人,教授。1993年毕业于福建师范大学政治教育专业,获得学士学位,并分配到福建师范大学福清分校工作,现为校思想政治教研部主任。1998参加浙江高师培训
从中国高校学位论文现状及问题的分析入手,同时辅之以与澳洲高校研究生学位论文的概况比较分析,对今后我国高校研究生论文质量保证与监督机制的建设与发展提出建议:改革人才培
独立学院是我国高等教育的重要组成部分,工程类学生在独立学院占较大比例,他们在学习基础和学习能力方面与普通高校学生有一定差距,其培养目标定位为工程应用型人才,实验教学
针对在少量有标签样本条件下传统方法训练不充分而且难以准确提取通信电台指纹特征的问题,文中提出基于边际Fisher深度自编码器的电台指纹特征提取算法.以深度自编码器为基础,训
本文根据高校后勤服务的特点,引出高校后勤危机和高校后勤危机管理的概念,并在进一步分析了高校后勤危机的诱因、主要特点、特殊性和构建高校后勤危机管理体系的必要性等基础上
针对目标跟踪中跟踪实时性和适应目标尺度变化的问题,提出在粒子滤波框架内基于簇相似度测量的实时目标跟踪算法,算法的外观模型使用改进的均值类哈尔特征表示.首先,根据采样半径
针对手指静脉识别技术中现有编码特征局部细节信息和区分性信息利用不充分的问题,文中提出基于最佳局部差值编码位(BLDCB)的手指静脉识别方法.设计局部差值编码提取方法获取图像的编码特征,提出基于相关性和散度的最佳位挖掘方法.引入条件概率计算编码位与目标的相关性,挖掘鲁棒位.计算鲁棒位之间的类间散度,获取具有区分性的鲁棒位,作为最佳位.在公开的Ploy U手指静脉数据库和MLA手指静脉数据库上的实验验
目的;研究梭曼(Soman)对大鼠急性中毒的自由基损伤作用及硒、锌的抗氧化保护作用.方法:雄性大鼠40只,按体重随机分为阴性组(正常对照组)、阳性组(损伤对照组)、硒组(加硒保护