翻译规则剪枝与基于半强制解码和变分贝叶斯推理的模型训练

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:geona
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计机器翻译一般采用启发式方法训练翻译模型.但启发式方法的理论基础不够完善,因此,会导致翻译模型规模庞大以及模型参数精确率不高.针对以上两个问题,该文提出一种基于变分贝叶斯推理的模型训练方法,形成更精确的精简翻译模型.该方法首先通过强制解码对齐语料,然后利用变分贝叶斯EM算法获得模型参数.该文的实验语料为NIST汉英翻译任务数据,实验结果显示,基于句法(基于短语)的统计机器翻译中,超过95%(76%)的规则被剪枝,且BLEU值显著提高.
其他文献
心尖部肥厚型心肌病(APH)是肥厚型心肌病的一种特殊类型,但以往对其认识不足,近年来由于超声心动图尤其是二维超声心动图的广泛应用,发现本病并非少见,我院自1997年8月到2001
偏头痛是临床常见病,是在遗传素质基础上形成的局部颅内、外血管对神经一体液调节机制的阵发性异常反应。临床上以反复发作的偏侧或双侧头痛为特征,其发病机理仍未完全阐明,曾提