【摘 要】
:
统计机器翻译可以通过统计方法预测出目标词,但没有充分理解原文语义关系,因而得到的译文质量不高。针对该问题,利用一种基于门控单元循环神经网络结构来对蒙汉神经机器翻译
【基金项目】
:
国家自然科学基金(61363052,61502255), 内蒙古自治区自然科学基金(2016MS0605), 内蒙古自治区民族事务委员会基金(MW-2017-MGYWXXH-03)
论文部分内容阅读
统计机器翻译可以通过统计方法预测出目标词,但没有充分理解原文语义关系,因而得到的译文质量不高。针对该问题,利用一种基于门控单元循环神经网络结构来对蒙汉神经机器翻译系统进行建模,引入注意力机制来获取双语词语的对齐信息,并在构建字典过程中对双语词语进行词性标注来强化语义,以此来缓解因欠训练导致的错译问题。实验结果表明,与RNN的基准系统和传统的统计机器翻译方法相比,该方法 BLEU值得到一定的提升。
其他文献
朝鲜语词性标注是朝鲜语信息处理的基础,其结果直接影响后续朝鲜语自然语言处理的效果。首先为了解决朝鲜语词性标注中遇到的形态素实际写法与原形不一致的问题,该文提出了一
近年来,我国数字图书馆发展迅速,为馆藏资源的深度挖掘和利用提供了基础。该文以数字化的方志古籍为研究语料,在全文人工标注的基础上,通过分析物产别名的内外部特征,构建基
手风琴在室内乐组合中,既能作为旋律乐器,也可以伴奏和声,还可以作为纯色彩性乐器.理查德.噶里亚诺作为法国鬼才手风琴演奏家,以手风琴、小提琴、贝斯及刮胡演绎的流行作品《
非投影结构是指依存树上的词语节点与原句中的词语序列出现错位的现象,对于句法分析器的影响较大,在语言理论上也有较大研究价值。在世界多种语言的依存树或图库上,都发现了