英汉机器翻译系统自动评测方法的研究与实现

被引量 : 4次 | 上传用户:skyzbc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译的评测对机器翻译技术的研究以及市场的推广具有重要的推动作用。评测的方法可以分为人工评测和自动评测,其中人工评测是指参照一定的标准和规范由人对机器翻译系统给出的候选译文进行评分;自动评测则是利用机器来完成这一打分过程,但要求打分的结果尽可能与人的评分相一致。本文的主要工作是对英汉机器翻译系统的自动评测方法进行细致的分析和研究。传统的机器翻译自动评测方法有很多,其中主要包括三种:BLEU、NIST、WER。BLEU的基本思想是通过统计翻译系统给出的候选译文和参考译文中共现n元词的个数和精度来计算评价分数。NIST在BLEU方法的基础上,提出了另外一种基于共现n元词的统计方法,它认为如果一个n元词在参考译文中出现的次数越少,那么该n元词包含的信息量就越大,就应该赋予更高的权重。WER方法的实质是通过对候选译文到参考译文之间的编辑距离进行某种归一化处理来对翻译系统的性能进行自动评测。尽管这三种方法给出的评测结果常常能够达到令人满意的相关性水平,而且BLEU和NIST方法已经被接受为国际标准,但是它们的评测结果在数值上与人工评测分数还有较大差别。正因如此,本文提出了NES /NED方法试图解决这一问题。NED /NES也是以编辑距离为基础,但是在理论上它的归一化处理比WER方法更合理,而且在实际应用中也比WER方法更接近人工评测的分数,同时与人工评测的相关性也不亚于其他方法。基于上面四种评测方法,本文设计并实现了一个英汉机器翻译自动评测系统---- ECEvaluation,该系统可选择大纲法和随机法生成测试集,而且可以分别从基于字和基于词两个角度对测试集的译文进行评测,同时提供了可视化界面使用户更直观的了解评测细节信息。通过对四个翻译系统的评测结果分析表明,该系统不仅达到了与“863评测系统”可比的水平和性能,而且它所包含的NED/NES与人工评测具有很好的相关性。
其他文献
热冲压成形技术,是利用金属热塑性成形的原理,能够在成形的同时实现对板料的淬火热处理,提高材料的成形性能,大大扩展了高强度超高强度钢在汽车零件的应用范围。但由于热冲压成形
传统上我们英语教学的重点是语言知识,而不是语言运用,学到的知识无法迁移到现实生活中。因此,我国学生经过多年的英语学习后,“听不懂,说不出”的现象比较普遍。随着交际教
我国是中药的发源地和最大的生产、使用国,中药材栽培和生产已经受到各界广泛的重视和关注。但由于中药材栽培和质量控制的特殊性,中药材生产规范和质量得不到很好的控制,中
居住形态是一个由自然、经济、社会和文化构成的空间系统,它包含两大方面的内容:住宅形式与居住生活。两者存在着密不可分的互动关系并共同受自然,经济,社会和文化等影响要素
随着高技术的发展及其在军事广泛应用,空袭与反空袭已成为战争的主旋律。在这样的情况下,联合防空战役问题亦成为我国新时期军事斗争准备的重大课题。因此,加强联合防空作战
土地和房屋自然属性的不可分性决定了两者在法律调整上的密切联系,但两者又具有价值的可分性和法律形态的独立性。不同的协调方法导致不同的立法模式。我国房地一体原则,自产
在各类发动机中,高温燃气以热辐射及对流换热的形式向燃烧室内壁、涡轮叶片等部件传热,而发动机内各部件又以导热、辐射等形式换热,换热情况非常复杂。发动机整体温度分布影响到
近年来,我国医疗体制在不断的深化改革,公立医院面临的竞争压力也越来越大。受这种情况的影响,医院要想获得发展就必须要注重对成本的控制,通过对资源的合理利用来使其发挥最
本研究中首先设计和优化了针对污水处理系统氨氧化细菌(Ammoni Odxidizing Bacteria,AOB)和亚硝酸盐氧化细菌(Nitrite Oxidizing Bacteria,NOB)分析的DGGE和Real-Time PCR技术,可分
作者在参加了导师林年丰教授主持的国家自然基金项目《吉林两部农业生态地质环境与农业可持续发展机制研究》、省攻关项目等多项科研工作,在实践中认识到土地盐碱化是本区的