论文部分内容阅读
本文引入领域自适应这一方法,对现有的统计机器翻译词对齐方法进行改进,其中主要过程是首先运用最大熵分类器方法对大规模双语平行语料进行筛选,再通过LDA模型对双语平行语料进行主题提取,然后训练每个主题对应的词对齐模型,进而得到翻译模型和语言模型。运用这种方法提高了翻译结果的准确率,使所得到的译文结果更符合人们平时交流的习惯。