论文部分内容阅读
统计机器翻译一般采用启发式方法训练翻译模型.但启发式方法的理论基础不够完善,因此,会导致翻译模型规模庞大以及模型参数精确率不高.针对以上两个问题,该文提出一种基于变分贝叶斯推理的模型训练方法,形成更精确的精简翻译模型.该方法首先通过强制解码对齐语料,然后利用变分贝叶斯EM算法获得模型参数.该文的实验语料为NIST汉英翻译任务数据,实验结果显示,基于句法(基于短语)的统计机器翻译中,超过95%(76%)的规则被剪枝,且BLEU值显著提高.