【摘 要】
:
针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题,在基于短语的统计机器翻译系统中,通过对传统短语抽取算法抽取的短语对进行分解、替换、
【机 构】
:
东北大学自然语言处理实验室,微软亚洲研究院
【基金项目】
:
国家自然科学基金(61272376;61300097);东北大学基本科研业务费研究生科研创新项目(N140406003);国家留学基金资助
论文部分内容阅读
针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题,在基于短语的统计机器翻译系统中,通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作,生成传统方法无法抽取的实例短语对。在汉英新闻和汉英口语翻译任务上,与基线系统相比,该方法在多个测试集上明显提高了翻译系统的翻译质量,在部分测试集上BLEU值可提高1%左右。
其他文献
<正>一、美剧走红原因雷蒙·威廉斯的文化研究指出,电视剧不是单纯的商品,它负载着特定人群特殊的"文化经验"和"感觉结构",只有编码者与解码者的文化经验和感觉结构相互交流
健美运动不仅拥有传统大众运动项目促进体能增长、运动水平提高以及强健体质方面的功能,同时具备增长力量,有效地发达全身肌肉、改善体形体态等特征。大学时期,加强体育锻炼,
为了探讨杜仲粉在凉山岩鹰鸡饲养中的应用,试验将500只35日龄凉山岩鹰鸡随机分成对照组和试验Ⅰ组、Ⅱ组、Ⅲ组,每组100只,每组设5个重复,分别添加0,1.5,3,4.5,6 g/kg杜仲粉
以北方寒区常用日加料6 kg干物质的8 m3户用沼气池为研究对象,测算其在中温发酵温度水平上日需热负荷为217.6 W,并在此热负荷下,将常用的几种增温方式与本课题组正在研究的生
口译(interpretation)作为翻译活动的一种实践形式,与笔译一样,从本质上来讲都是在寻求原语(source language)与目标语(target language)之间的意义对等。本文旨在呼唤广大读
头痛是颅脑损伤术后十分常见的临床表现,多数患者还同时伴有头晕、目眩、乏力倦怠、食欲不振、记忆力减退、烦躁等诸多症状。本文回顾总结2004年1月~2009年1月来我院门诊就医
桃原产我国,人工栽培历史悠久,至今已有3000多年的历史,是山东省重要的果树资源,栽植规模和产量仅次于苹果,是山东省第二大果树品种。青州蜜桃作为青州市的主推品种,一直在国
基于移进一归约的句法分析系统具有线性的时间复杂度,因此在大规模句法分析任务中具有特别实际的意义。然而目前移进一归约句法分析系统的性能远低于领域内最好的句法分析器,例
目的研究复方苦参注射液联合止痛药治疗中重度癌痛的临床疗效。方法在2017年3月~2019年3月本院中重度癌痛患者中选取82例,根据信封法分为研究组(n=41)和参照组(n=41)。其中单
随在经济高速发展,国内建筑工程行业已经进入了发展的新高潮,企业间的竞争也在不断加剧。得益于此,国内民众的居住环境得到了很大的提升。工程管理是保证实际施工质量的关键,