基于多分支树的学术论文神经机器翻译研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hljsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于计算机技术快速发展,特别是近些年来图像处理单元(GPU)的投入使用,神经网络已经不再像刚被提出时那样遥不可及。神经机器翻译(NMT)就是将神经网络应用到传统的机器翻译领域来,利用神经网络的特性实现机器自主学习翻译规则,代替人类执行语言翻译任务。在深度学习技术浪潮的冲击之下,机器翻译的研究者们开始思考以新的角度来推进以前尚未解决的问题。本研究课题就是在这样的背景下,尝试使用多分支的树形深度学习网络来研究学术论文的机器翻译问题。本课题的研究是一次探索尝试过程,希望能对后期其他的研究以启发。通过对传统神经机器翻译网络的研究,以及对树形深度学习网络的应用分析。本研究意在构建一个结合传统神经网络和树形深度学习网络的多分支树形神经机器翻译机网络(MbTbNMT),通过对神经网络的重新建模来捕捉学术论文语句中的语法、语义信息。首先,本文在最开始对传统的神经机器翻译和树形深度学习网络进行了介绍,介绍主要以树形长短期记忆网络(Tree-LSTM)为重点,详细说明了它的原理和构建过程。针对需要的用到的算法只作了简单的介绍。然后,详细介绍了所研究的MbTbNMT模型实现方法,通过对LSTM编码器的隐状态节点进行树形建模,使得上级节点含有更多子节点信息。结合Attention机制使模型能够提取到学术论文的语法信息。接下来,介绍了一种新的基于网络爬虫的训练语料构建方法。本研究在Tensorflow深度学习平台上搭建并实现,利用新的训练语料对搭建模型进行训练。检测该模型对学术论文语料的翻译性能,实验结果表明其翻译性能有所提升。训练时,为了加快收敛过程,我们采用了随机梯度下降(SGD)对模型进行了优化。最后,同一语料上对比分析了MbTbNMT与两种经典机器翻译模型的翻译结果。相比于经典模型,MbTbNMT不仅能更多地提取到学术论文语法信息,而且系统困惑度更低,更好地实现了学术论文的机器翻译。
其他文献
我国古代的死刑复核制度是一种极具有中国特点的刑事诉讼制度,同时它也是中华民族五千年来优秀诉讼法律文化的宝贵遗产。我国现阶段的死刑复核制度在一定程度上源于我国古代的
本文以梁子湖中华沙塘鳢为研究对象,对其年龄与生长、胚胎发育、消化道的组织学进行了研究,主要研究结果如下:1.中华沙塘鳢的年轮特征为疏密切割型。其年龄结构主要由0+-3+龄
和谐文化作为观念形态的文化,其产生和发展既是历史的必然,又是现实需求的结果。建设和谐文化,必须从建设社会主义核心价值体系、培育文明道德风尚、营造良好思想舆论氛围、
目的初步分析牛津膝关节评分量表(Oxford knee score,OKS)应用于中国东北地区膝关节骨关节炎(knee osteoarthritis,KOA)评定的信度和效度。方法选取2017年9月1日至2018年9月1
采用聚合物poly(N-vinylcarbazole)(PVK)掺杂小分子蓝色荧光材料N,N′-bis(naphthalen-1-y)-N,N′-bis(phenyl)benzidine(NPB)作为蓝色发光层,将PbS量子点与环氧树脂的混合物
2008年8月至2009年8月间,于西藏雅鲁藏布江仁布县至谢通门江段共采集尖裸鲤(Oxygymnocypris stewartii)712尾,通过对采集样本的测定和分析,研究了尖裸鲤的生活史和种群动态学
<正>《黑龙江省"两大平原"现代农业综合配套改革试验金融改革方案》已于今年5月6日出台,全省各级人民银行紧抓这一加快黑龙江省农村金融改革创新,推动和支持现代农业发展的一
对IC反应器的结构、原理进行了简要介绍,并结合其工艺思想及应用实例指出IC反应器是对现代高效厌氧反应器的一种突破,具有处理效率高,抗冲击能力强等特点,有着重大的理论意义
铝合金电阻点焊技术是一项即将在汽车制造中获得广泛应用的技术,电极状况对焊接质量影响较大.研究了不同电极条件对TE50铝合金电阻点焊质量的影响,通过试验确定了取得最佳点
目的观察不同刺法针刺颈夹脊穴治疗颈椎病的临床疗效。方法选取我院收治的80例颈型颈椎病患者随机分两组,对照组40例给予常规针刺颈夹脊穴治疗,观察组40例给予电针刺激颈夹脊