面向军政领域的社交网络英汉神经机器翻译研究

来源 :战略支援部队信息工程大学 | 被引量 : 0次 | 上传用户:jiangguoliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络是网络时代社会生活不可或缺的组成部分,既是国内外交流合作的大平台,也是国家之间竞争博弈的主阵地。海量军政信息在社交网络中传播,其翻译任务也成为了服务于国家军事、政治、外交战略的必要需求。在大数据背景下,传统的人工翻译模式已经无法满足社交网络中军政领域数据高质量和即时化的翻译要求。另一方面,社交网络语言的特异性为理解和翻译带来了新问题和新挑战。面向社交网络研究军政领域网络语言特点及自动翻译方法具有突出的理论意义和应用价值。当前基于深度神经网络的英汉机器翻译已经取得了显著进步,在新闻领域甚至取得了媲美人类译员的测试成绩。然而,使用现有的主流英汉神经机器翻译系统对军政领域社交网络文本的测试结果表明,机器译文仍然存在许多翻译问题,离满足实际应用需求还有不小的差距。针对军政领域社交网络语言特征所导致的突出问题,本研究通过构建网络非正规语言表达库和军政领域社交网络双语平行语料库,探索了融合先验知识的神经机器翻译模型构建方法,有效提升了军政领域社交网络英汉神经机器翻译的译文质量。本文的主要工作如下:1.军政领域英语社交网络语言特征分析与网络非正规语言表达术语库构建。军政领域社交网络语言具有鲜明的特征,对这些特征进行分析、总结、提取,构建军政领域社交网络语言特征术语库。2.军政领域社交网络英汉双语平行语料库设计与构建。语料的量和质是训练神经网络机器翻译模型的基本条件,是影响模型性能的重要因素,然而社交网络中军政领域英汉双语平行语料在量和质两方面都面临着极大的困难。本研究提出了一种预处理手段和机器翻译引擎相结合的垂直领域双语语料生成方法,用于构建、扩展、优化军政领域社交网络英汉双语平行语料库,并通过实验验证了该方法的有效性。3.融合军政领域社交网络语言特征的神经机器翻译模型构建。本研究标注了军政领域社交网络语言特征,构建了基于BPE算法的分词模型,将英汉训练数据的语言特征在编码端和解码端进行拼接和对齐,融入基于m Bart预训练模型进行微调的神经网络结构和Transformer神经网络结构。4.实验与结果分析。基于m Bart预训练模型进行迁移学习的方法虽然能够提升BLEU值,但是整体翻译效果较差。在Transformer结构上,融入语言知识比不融入语言知识提升了3.35个BLEU值,译文质量在词汇层面得到了显著优化,证明了融入语言特征能够对社交网络中军政领域内容的机器翻译产生积极效果。
其他文献
“非遗”又称非物质文化遗产,指的是在各族人民中世代传承,并视为人民精神文化凝练组成的各类传统文化的表现形式,其所承载的精神内涵和文化记忆更是可以代表一个民族的灵魂。自2006年第一批国家级非物质文化遗产确立后,人们将更多的目光投射于非物质文化遗产的保护与传承,一系列有关非遗文化的保护措施也相继出台。其中,以拍摄非遗题材纪录片为代表的现代影像传媒技术依靠其传播特点,在记录非遗技艺的同时为其提供更为广
学位
中国一直是传统的水产养殖大国,其产量超过全球的1/3。中国的传统渔业主要以家庭化的小规模为主,但在家庭养殖中,养殖人员往往是通过经验来判别水质情况,并且容易出现因个人操作不当导致的水质恶化。本文将设计一种可以协助养殖人实现鱼塘精细化管理,并能检测适合鱼塘水质环境的水质检测平台,本文主要进行了以下研究工作。(1)分析了鱼塘养殖的主要参数,平台在水质检测上选择溶解氧、PH、氨氮、磷酸盐四个参数来评价鱼
学位
随着我国企业集团发展规模的不断扩大和组织结构的复杂化,“存贷双高”、资金闲置等资金管理问题日益凸显,越来越多的企业集团选择资金集中管理。而财务公司作为企业集团子公司和金融机构,在集团资金集中管理中具有灵活性强、功能全面等诸多优势,我国越来越多的大型企业集团通过设立财务公司进行资金集中管理。但与国外财务公司相比,我国财务公司行业发展较晚和不够成熟,企业集团财务公司资金集中管理依然存在各类问题,不利于
学位
作为消费品,家居产品的行业知名度、顾客对品牌的知名度,对家居企业的发展都起着非常重要的作用。企业要保持自身的竞争力,保持战略领先地位,就必须在市场中树立好的企业形象,创造核心竞争优势。在大数据发展迅速的时代,互联网经济迅速崛起,中国和世界经济都在发生着巨大的变化,消费市场和消费结构也随之改变。随着电商的崛起,人们可以足不出户购买各种商品,移动支付让人们的生活更加便捷,物流也让网购更加接近实体店铺的
学位
大学生是就业市场中具备较高素质的人力资源,党和国家高度重视对其提供的就业服务工作。高校就业服务是连接大学生和用人单位的重要桥梁,但作为人才培养的末端环节受重视度不够。随着5G时代的到来,特别是新冠肺炎疫情的爆发,就业市场快速变动,因而对就业服务提出更高的要求。在此背景下,高校就业服务急需进行服务模式升级和智慧化转型。本课题通过对国内外高校就业服务的研究发现,目前的研究工作中缺乏对大学生的求职行为和
学位
甲烷作为煤炭开采过程中的副产品,泄露到空气中易形成爆炸性混合气体。甲烷爆炸作为煤矿井下最危险的事故之一,一旦发生,会造成大量人员伤亡及巨额财产损失。而井下巷道发生甲烷爆炸受各种障碍物(不同的通风设备、不同面积的巷道截面、堆积物)的作用,会对爆炸危害产生不同程度的影响。因此深入研究障碍物对甲烷爆炸特性的影响具有重大意义,为井下减小甲烷爆炸风险提供科学技术理论支撑。该研究通过自主设计并搭建了小尺寸实验
学位
随着交流技术以及多元文化的发展,意义表达也随之发生了很大的变化。新伦敦小组于1994年首次提出多元识读的概念。英语教育硕士对于培养未来学生的多元识读能力至关重要。因此,本研究旨在探索英语教育硕士的多元识读能力现状。本研究以某校学科教学(英语)专业的23名研究生为研究对象,将其在专业课程上的30个多模态PPT语篇为研究材料,采用多模态语篇分析、半结构化访谈两种研究工具,对英语教育硕士的多元识读能力现
学位
本研究采用ERP技术,以6~11岁汉语高功能自闭症儿童为对象,根据转喻发展的阶段性具体分为6~8岁和9~11岁两个年龄段,对其常规转喻和新奇转喻进行了发展轨迹和内部加工机制上的探索。实验材料除常规转喻句和新奇转喻句外,还设置了直义句和错误句,从句子内部词汇概念间的关联程度来说,错误句的关联程度最小,直义句的关联程度最大,二者作为对比和参照,有利于清晰探索不同年龄段的汉语高功能自闭症儿童对常规转喻和
学位
本研究从揭示4-7岁汉语高功能自闭症儿童心理理论能力发展的整体概貌出发,考察补足语句法结构理解、心理动词和行为动词事实性理解能力与其心理理论能力之间的关系。本研究以实龄、言语智商、操作智商和总智商为匹配标准,选取了60名4-7岁智商分数均值高于110的汉语高功能自闭症儿童和60名典型发展儿童。本研究包含四个实验,实验一采用意外地点错误信念任务考察自闭症儿童被试心理理论能力发展的整体概貌,通过和典型
学位
蜀派是清代中后期于巴蜀地区形成的古琴流派,其创立标志是《天闻阁琴谱》以及一个以张孔山为核心的琴人群体,传承至今已经有一百多年。蜀派的传承主要分为师徒传承、家族传承以及特殊群体传承,其中家族传承又是最稳定最重要的传承方式。在百余年的传承中,蜀派发展了两支脉络清晰可考的家传系统,一为顾氏一脉,一为叶氏一脉。本文将在考察蜀派古琴传承的基础上,进一步分析“同源异脉”的顾、叶两脉之间的区别与联系。本文正文部
学位