基于最大熵短语重排序模型的特征抽取算法改进

来源 :中国中文信息学会 | 被引量 : 0次 | 上传用户：huanyou123

【摘要】

：

本文针对统计机器翻译中基于最大熵短语重排序模型特征抽取算法。提出一种改进算法。该算法能够抽取出更多准确的短语重排序信息，特别是逆序短语的特征信息，解决了原算法中最大熵训练时特征数据不平衡问题，即保序短语特征信息数量远超过逆序短语信息数量，提高了翻译中短语重排序的准确率。本文以NIST MT 05作为汉语到英语翻译的测试集，实验结果表明改进后的系统BLEU值比原系统提高0.65％。

【作者】

：

孙萌姚建民吕雅娟刘群姜文斌

【机构】

：

中国科学院计算技术研究所,北京 100080 苏州大学计算机科学与技术学院,苏州 215006

【出处】

：

中国中文信息学会

【发表日期】

：

2010年8期

【关键词】

：

最大熵特征抽取统计机器翻译重排序模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于最大熵短语重排序模型的特征抽取算法改进

其他学术论文