基于Transformer的生成式对话系统

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yjq360124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言处理任务中,对话系统是其最具有发展前景的关键应用方向之一。基于检索和基于生成是目前现有对话系统实现的主流方法。检索式的方法是从候选回复进行打分并选择,提供相对固定模式化的回复,基于检索的系统严重依赖语料库的大小和质量,导致候选回复可能会缺失上下文中的重要信息,而且基于检索的方法限制了产生回复的丰富性,输出结果比较生硬。因此,为了让对话系统更好地完成信息表述以及情感表达等任务,使用基于生成式的方法来构建对话系统,使得对话系统产生的回复更为自然生动且符合上下文关键信息。本文在已有的对话模型基础上,研究如何增强对话模型的词意和语义理解能力以及多轮对话条件下信息衰弱的现象。本文的主要内容如下:第一、目前中文的对话系统和英文对话系统相比,由于中文信息更为复杂,并且词语的边界划分具有偏差,因此现有的对话系统性能并不理想。针对现有研究的不足,本论文设计了基于Transformer的中文生成式对话系统,仅使用多层Transformer解码器构建系统,并使用不完全Mask掩码的设计来实现单向语言生成,即问句可以双向感知上下文信息,而回复句只能单向自回归输出。通过自回归的方式每次输出一个词,生成新词后,将该词添加到输入文本序列后面,新的文本序列会成为模型下一步输入,如此循环直到产生结尾标识符为止。本系统的流程使得单向生成对话任务更加具有逻辑合理性,性能也优于传统的对话系统方案。第二、为了增强对话系统对词意和语义的理解能力,本研究提出字词融合的Embedding优化方法,引入预训练语言模型的词嵌入矩阵与对话任务中的字向量进行融合,并通过使用稀疏Softmax来避免过拟合问题。通过实验对比验证字词融合Embedding的优化方法对中文生成式对话系统的性能有进一步提升,验证该优化方法的可行性。第三、通过分析发现绝对位置编码会产生远程信息衰弱现象,因此提出使用相对位置编码进行改进,在Transformer模块修改Self-Attention的计算公式,通过加入相对位置信息替代位置嵌入层的绝对位置编码,以此来增强长距离注意力。通过实验结果验证表明,使用相对位置编码能够减少信息远程衰弱现象。
其他文献
随着数字化技术的不断发展和成熟,软件化雷达应运而生。软件化雷达是基于标准化、模块化的数字平台,具有开放式体系架构,采用面向应用的开发模式,系统功能通过软件定义、扩展和重构的新型雷达系统,是未来雷达系统发展的重要方向。本文针对传统雷达系统体系架构兼容性和通用性差,软硬件耦合度高的问题,开展了软件化雷达在线可重构技术的研究,重点研究了在线可重构开放式架构、面向服务的组件模型以及重构管理系统。论文的主要
如今,数字成像技术已经被广泛应用于高动态范围成像和低动态范围增强等领域,但在终端设备性能快速迭代的市场环境下,基础图像在效果表现上依然受限于显示屏幕的动态范围。而目前针对图像动态范围优化的研究主要基于软件环境,性能有限,无法满足SOC图像显示系统的实时性要求。基于这一现状,论文对图像显示相关技术进行研究,并针对色调映射算法实现硬件设计与验证。论文首先阐述了色调映射技术的应用背景,并调研了国内外对色
随着世界经济的迅速发展,人们对石油的需求越来越大。因此,如何在石油开采、勘探以及钻井工作中对信息进行传递和分析已经是研究发展的一个热点。电磁式随钻法测量技术主要指的是上个世纪80年代从事石油资源开采、煤炭资源开采等工业应用领域研究而来的一种新型测量方法。采用先进的电磁波传输方式操作简便容易实现,传输的速率相对比较高,传输的可靠性强,在测量工艺过程中针对循环钻井液和循环介质的需求小,可以广泛地适用于
磁约束托卡马克聚变研究涉及众多前沿科学和工程技术难题,理论预测和实验诊断共同发展的状态。然而单独依靠诊断难以满足放电实验数据实时重构的需求,如温度密度长期难以得到完整的剖面数据,分辨率不足导致磁约束托卡马克装置物理剖面无法描述高约束模式(H模)放电的台基物理参数剖面。基于此,本研究基于通用原子能公司(General Atom,GA)为主开发的OMFIT集成模拟平台,结合HL-2A/M实验数据和理论
吸波涂层一般指一种喷覆于材料和器材表面,具有特殊微波性能的材料涂层,其使用的涂料一般又被称为微波吸收涂料,在军用以及涉密航空器应用领域也被称为雷达波吸收涂料。目前被广泛运用于相关领域的涂层材料吸收剂主要分为非金属材料基材与含金属材料基材两大部分,其中运用相对广泛的含金属材料基材可分为导电聚合物系列、多晶铁纤维系列以及铁氧体系列等。涂层本身的材料特性,基材本身的材料特性和涂覆表面的物理特性是影响涂层
随着工艺技术的发展,现代VDMOS可承受的击穿电压值越来越高,常规的VDMOS结构由于极厚的外延层,因此导通电阻值随着耐压的增加而大幅增加,高压VDMOS器件为了降低导通电阻只能通过增加芯片面积的方法,但随之而来的成本的增加又是商业生产不可忽视的因素。目前国内具有优良特性的高压VDMOS产品较少,大多微电子公司选择进口国外的VDMOS器件,而随着半导体进口量超越石油成为进口量最大的商品,自主研发高
随着科学技术与社会向前发展,无人驾驶技术的发展日新月异,登机桥也随之朝着自动对接方向发展。环境感知传感器作为无人驾驶的“眼睛”,一般有毫米波雷达、超声波雷达、激光雷达以及摄像头,但是单一传感器由于各种原因对环境的感知存在局限性。多传感器融合技术能够综合各传感器优势,实现相互之间信息互补,为系统提供信息冗余。因此本文基于两种感知系统中主流的传感器提出一种毫米波雷达与视觉融合的登机桥前方目标识别方法,
大数据是网络信息时代的客观存在,其产生的意义在于对数据进行专业存储和处理,并从中挖掘和提取所需要的知识和信息。Hadoop作为数据分布式处理系统的典型代表,在数据的分布式存储、计算、分析等多方面性能优越,为提升资源的利用率,Hadoop引入了资源统一管理调度系统YARN。YARN自带了三种资源调度器用于同构集群环境资源的分配,随着虚拟机在各大数据中心的普及,集群异构性凸显,这些内置的调度器性能极速
随着深度学习的逐步发展和计算机视觉应用领域的不断扩大,基于实验室环境下的非自发人脸表情识别已经不再是一个挑战,学界的研究重点已经转向自然环境下的人脸表情识别。尽管自然人脸表情数据集更加贴近于真实场景,但由于其样本偏小,且存在遮挡、姿态变化、光照不均等外在干扰因素,导致所训练出来的表情分类模型容易出现严重的过拟合现象。目前,如何准确地识别自然环境下的人脸表情已经成为人脸表情识别领域的主要难点之一。本
随着高速数字电路的发展,模数转换器(analog-to-digital converter,ADC)已经成为现代数字处理系统中不可或缺的组成部分。ADC的性能指标对数字处理系统整体的指标和性能的影响都十分显著,随着ADC分辨率的不断提高,现有的标准测试方法实施过程越发的困难,传统基于正弦拟合的测试方法,具有更高的测试精度,但该算法测试时间较长,限制该算法在实际测试中的应用。本文主要基于极大似然估计