基于Transformer的自然语言生成算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cc_7722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近些年来自然语言处理以及深度学习的飞速发展,自然语言生成领域展现出了新的活力,为迎合用户多种需求而产生的自然语言生成场景也成为了学术界和工业界探讨与研究的热点。自然语言生成可以简单划分为数据到文本的生成以及文本到文本的生成,旨在通过分析并理解输入的数据或文本,进而撰写得到符合用户需求的自然语言文本。自然语言生成技术已经广泛应用在了智能助理、机器翻译、人机对话、智能写作等领域,并成为了人工智能逐渐走向成熟的标志。当前,文本到文本生成任务的主流做法是进行序列到序列的建模,使用“编码器-解码器”框架,包括三个步骤:对输入的原始文本提取语义特征信息;将原始文本的语义信息映射到输出的语义信息;对语义信息进行语言建模。文本到文本生成算法的困难在于:输入的原始文本语义信息冗杂,且具有多义性;另外,当前主流的模型都是采用Transformer模型,而Transformer的核心结构点积注意力机制是通过实例级标记到标记的交互来学习权重的,缺乏一致的上下文语境。为了解决上述问题,本论文研究并实现了基于端到端的Transformer网络的条件文本生成算法。首先,引入了分支卷积结构,使用不同大小的卷积核的卷积网络来提取输入文本中不同的语义信息,以丰富语义特征;然后,本论文提出了全局交互注意力机制,使得模型兼顾到了全局语境。实验结果证明,本论文提出的算法在文本摘要任务、条件故事生成任务、条件情感类别生成任务中均优于目前的主流算法,尤其是在文本摘要任务中,ROUGE-1、ROUGE-2、ROUGE-L指标比最新的文本摘要算法Uni LM分别提高了0.07%、13.06%、0.72%。接下来,本论文研究了图像到文本的生成,并由此延伸到对应的文本到图像生成任务,经典的图像到文本的生成以及文本到图像的生成是两个独立的特定于任务的模型。本论文以多模态Transformer作为主体模型,利用Transformer与任务无关的设计,将图像到文本的生成和文本到图像的生成都看作是序列到序列的生成,来实现一个统一的框架;此外,还提出利用交叉熵损失函数与KL散度共同监督图像到文本的生成,利用MSSIM损失函数来监督文本到图像的生成。实验结果证明,本论文提出的算法对比特定于任务的文本到图像的生成模型DM-GAN,在CLIPScore指标上有8.7%的提升,并将FID指标结果降低了13.1%;对比最新的双向生成模型X-LXMERTFT,在BELU@N、ROUGE-L、METEOR、CIDEr-D、SPICE、CLIPScore各项指标上分别有19.9%、6.6%、7.3%、16.7%、11.0%、7.2%的提升,并将FID指标结果降低了8.8%。本论文研究并实现的条件文本生成算法和双向图像与文本生成算法可以应用在文本生成任务(如智能写作、新闻标题生成、故事生成等)、图文跨模态任务(如图文互搜、图片预览等)等多种场景,对自然语言生成发展和应用具有一定的理论意义和实用价值。
其他文献
高分辨率遥感影像包含了丰富的目标特征和地物细节,可准确反映不同地物间的细微差异,为人们深层次地研究地物的特性提供了可靠的手段。遥感影像道路提取是遥感影像处理中最为基础的任务之一,受到众多研究者的关注,并广泛应用在民用和军事相关领域,包括城市规划、减灾估测、野外救援和作战部署等。随着深度学习技术的发展,深度网络在特征提取精度、效率方面展现出了显著优势,迅速成为遥感影像道路提取领域的主流方法。现有的深
学位
第一部分miRNA-223-3p/CHUK/NF-κB通路对慢性淋巴细胞白血病生存调控机制研究背景及目的:慢性淋巴细胞白血病为一种不能治愈的恶性肿瘤,是西方国家最常见的白血病类型,同时也是我国中老年人中常见的血液系统肿瘤。miRNA-223-3p已经被证实在慢性淋巴细胞白血病患者中表达下调,是有意义的独立不良预后因素。然而miRNA-223-3p在慢性淋巴细胞白血病细胞发挥的生物学功能及涉及的具体
学位
水分子的解离是煤化学和可再生氢能源转化过程中的决速步骤。因此,合理设计催化剂、充分阐明构效关系,对获取高性能水分解催化剂具有重要意义。氧空位(Oxygen vacancy,Vo)是金属氧化物中最常见的阴离子空位,它能改变缺陷位点附近的局部电荷分布和电子能级。在催化反应中,Vo可以提供更多的催化活性位点,并显著影响金属与载体之间的电子转移和电子相互作用。Vo以其独特的物理化学性质在催化水分子解离过程
学位
背景恶性肿瘤是威胁人类生命健康的首要疾病,化疗是其综合治疗的重要组成部分,但传统小分子化疗药物存在毒副作用强、靶向性差、易耐药等缺点。纳米载药系统具有可控制药物释放、延长血液循环时间、增强生物相容性及肿瘤靶向性等优势,是肿瘤化疗以及联合其他治疗方式的研究热点。放射治疗是无法手术的局部晚期肿瘤的治疗方法之一,通过细胞水电离产生细胞毒性氧自由基,可无深度限制的杀死癌细胞,但因受限于周围正常组织的破坏而
学位
晶体生长前沿是否存在预有序结构或预有序相是经典一步生长模型和多步生长模型的本质区别。深入理解高分子相转变中晶体生长机制是改变聚集态结构,继而调控其性能的关键,也是高分子物理与高分子加工中的重要研究课题。片晶生长前沿的界面层不但可能包含中介相(其有序程度介于晶体与无定形相之间),同时还可能包含有形成中介相前的熔体和中介相结晶形成的初生微晶。界面层结构的快速演化和空间分布上的非均质性,导致现有表征方法
学位
<正>自2014年起,福建省教育厅每年定期举办"福建省高校师范生教学技能大赛"(以下简称"省赛"),"中学组"除化学学科之外,其余学科的比赛内容,均为初二年级内容,比赛的核心环节是15分钟的片段教学.在指导学生训练和参赛的过程中,发现了教学中存在的种种问题,有些问题在一线教学中也存在,具有一定的普遍性,现归纳为以下八个方面阐述之,希望对数学教学有所裨益.
期刊
针对激光选区熔化(SLM)成形件表面粗糙度较高这一问题,基于SLM分层加工原理,以台阶效应、粉末粘附和翘曲变形为主要影响因素,建立了下倾斜表面粗糙度的预测模型。选用激光选区熔化成形316L不锈钢零件,并测量零件的下倾斜表面粗糙度,表面粗糙度的测量值与预测值进行对比分析。实验结果表明:熔道搭接与台阶效应相结合、粉末粘附现象的等效变换以及翘曲变形后的角度变化三种建模思路是可行的,粗糙度预测模型的主要参
期刊
作为垄断协议中的新类型,轴辐协议兼具横向垄断协议与纵向垄断协议的双重属性,突破了早已形式化的垄断协议二分法的枷锁,在具有巨大危害的同时却缺乏有效的反垄断法规制。这既因为轴辐协议本身的特殊结构在理论上带来了理解与认定的双重困境,影响了执法机关的主动性;又因为我国《反垄断法》缺少对轴辐协议的必要回应,使得依照现有垄断协议规制路径无法实现有效规制。由此,为探寻轴辐协议的最佳规制路径,应在彻底理解轴辐协议
学位
受限于采集设备、传输网络和压缩技术等现实条件影响,视频文件在采集、压缩、传输、解码、显示的过程中,不可避免会产生失真。视频质量评价方法(Video Quality Assessment,VQA)旨在为存在失真的有损视频提供符合人类视觉感知的质量评价。因其在衡量视频处理系统性能以及评估用户视觉体验上具有不可或缺的价值,VQA技术被广泛应用于视频媒体平台、终端设备、无人机采集系统等。现有客观VQA算法
学位
激光选区熔化凭借近净成形优势在钛合金加工领域展现出巨大应用潜力,其快速冷却条件形成的特殊组织带来了优异性能,因而受到广泛关注。亚稳β钛合金因其出色的机械性能逐渐应用于航空航天领域,本研究采用真空电弧熔炼(VAM)和激光选区熔化(SLM)制备了Ti-1023合金试样,并对其组织性能进行测试分析。结果表明:SLM快速冷却条件抑制了β→α的相变过程,形成全β相组织,而VAM试样为α+β双相组织构成。虽然
期刊