融合短语知识的神经机器翻译技术研究

来源 :沈阳航空航天大学 | 被引量 : 0次 | 上传用户:huanan_0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化和网络化的迅猛发展,全球一体化进程急剧加快,人们对实用化语言转换技术的需求日益迫切,机器翻译技术引起了越来越多研究人员的兴趣。目前,最先进的机器翻译方法是神经机器翻译。相较于传统的统计机器翻译方法,神经机器翻译直接利用神经网络实现源语言文本到目标语言文本的映射,不需要人工设计特征,并且能够充分利用句子中的上下文信息,使翻译效果得到了显著提升。但是,主流的神经机器翻译方法以单词为基本处理单元,对短语的建模能力有限。而基于短语的统计机器翻译方法能够从大规模双语语料库中自动学习源语言和目标语言之间的短语翻译知识并建立相关的概率模型,在短语翻译方面具有一定优势。如何将两种翻译方法结合起来,使其优势互补,是一个重要的研究问题。针对上述问题,本文开展了融合短语知识的神经机器翻译技术研究。本文提出了一种基于后缀的短语知识表示方法,通过对源语句进行句法分析,进而识别句中的短语,并与统计机器翻译系统生成的短语表进行匹配,产生双语短语片段,以后缀的形式添加到源语句的尾部,作为指导神经机器翻译中短语翻译的约束信息,将添加短语表示的源语句输入到编码器,使短语知识融入神经机器翻译编码产生的句向量,提升翻译效果。在中英语料上进行的对比实验表明,将短语知识融入源语句后进行编码,能够提高机器翻译的准确率,即在神经机器翻译编码器中整合合适数量的短语翻译信息可以有效地指导译文的生成。
其他文献
这个世界正在发生一场前所未有的科技冤案,它是美国动员其盟友国家试图对中国高科技公司华为实施“绞杀”。$$美国不仅自己排斥华为从电信设备到手机的各种产品,而且要求其盟国
期刊
研究气温对植被覆盖度和ET(Evapotranspiration,ET)的影响,对干旱区应对气候变化、维系生态系统稳定具有重要意义。基于阿勒泰地区及周边7个气象站,CRU数据集中的气温数据及M
公司治理结构是20世纪80年代以来经济学界和法学界所共同关心的重要课题.本文在考察公司治理结构的含义和各国治理模式的基础上,针对我国的现实,结合经济学和法学的相关理论,
"对极"是西方研究中国问题的学者使用的一个词,意思是说中国与西方在文化特征上有着截然的对峙关系.用它来说明中西方的法现象也不无道理.哈佛大学昂格尔教授在分析欧洲"法的
近年来,深度学习的研究热潮迅速渗透了自然语言处理研究的各个领域,其中也包括了机器翻译领域。深度学习给机器翻译带来了极大的改变,使之不再需要面对传统统计机器翻译中的
“领导”一词的本质含义是研究领导学各个领域的出发点。对“领导”本质的界定成为西方众多学者关注的研究焦点。在这样一个对“领导”本质界定众说纷纭,百家争鸣的年代,对他
人力资源管理作为企业管理中的重要内容,必须提高其管理的质量和水平。但是由于衡量员工工作质量的影响因素较多,很难得到公平公正的评价标准。本文以胜任力为基础,介绍了基
跨境商品销售后会因为各种问题退回,增加海外仓二次销售压力。为保障收益,通常将商品进行二次销售和海外仓订货结合起来。本文分析了影响海外仓无缺陷退货最优订购量的因素,
基于全渠道环境下,考虑B2C零售商提供全额退款保证,建立了同渠道退货策略和全渠道退货策略下的博弈模型,研究B2C零售商的退货渠道策略选择问题。结果表明,全渠道退货策略下,B
非规模畜禽养殖污染是当前广大农村环境污染的主要来源之一。进一步加强非规模畜禽养殖污染治理,推进非规模畜禽养殖场户污染治理和粪污资源化利用势在必行。非规模畜禽种类