自纠正词对齐

来源 :计算机科学 | 被引量 : 0次 | 上传用户:tp20201892
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词对齐是统计机器翻译系统的重要一环,但词对齐的获得往往基于序列模型的计算,而没有考虑语言的结构化信息及语言特征,从而造成词对齐中出现一些不符合语言特征的结果。文中提出一种词对齐的自纠正机制,以纠正词对齐中的错误部分。该机制使用一些语言学上的先验知识,对词对齐结果进行由粗颗粒度到细颗粒度的纠正。首先采用基于标点的方法对句对进行粗粒度化纠正,然后采用基于统计特征的方法对子句对进行细粒度化纠正。该自纠正过程不需要借助任何其他词对齐工具和新语料。实验结果显示,自纠正词对齐显著提高了词对齐的准确率,并提高了机器翻译的质量,其中粗粒度的纠正方法对翻译质量的提高最为显著,细粒度的纠正方法也提升了翻译质量,最终通过结合粗颗粒度和细颗粒度的纠正方法,使翻译结果相对基准系统取得了显著的提高。
其他文献
本文从模拟电路故障诊断的研究现状入手分析,就当前模拟电路故障诊断的各种方法进行了简单的描述,并对其优缺点进行了归纳总结,对模拟电路故障诊断领域的热点问题进行了讨论
当前,全球汽车工业的发展已经达到了前所未有的高度,然而,温室效应、污染排放、资源消耗、废物处置等汽车生产和使用阶段所产生的一系列负面环境影响构成了对汽车工业可持续
会计工作作为经济管理的一种手段,以信息系统的表现形式参与经济管理。在市场经济高速运转的今天,会计工作所发挥的作用越来越大,越来越重要。会计信息以各种方式渗透了社会
2016年9月2日,执政27年之久的乌兹别克斯坦总统卡里莫夫逝世。原政府总理米尔济约耶夫担任代总统并在2016年12月5日总统大选中赢得多数票,正式开启乌兹别克斯坦的“后卡里莫夫时代”。卡里莫夫执政时期,乌遵循的是一种“自守、自主”的外交原则,这一原则虽确保了乌局势的长久稳定,但也留下了诸如国内经济发展缓慢、与周边中亚邻国关系不睦等诸多弊病。米尔济约耶夫上台后,开始着手在内政外交方面推行一系列的改
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
脑性瘫痪(简称脑瘫)是自受孕开始至婴儿期非进行性脑损伤和发育缺陷所导致的综合征,主要表现为运动障碍和姿势异常[1]。本病是儿童期致残的主要疾病之一,其中肌张力低下型脑瘫