基于Transformer的自动问答技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户：BalloonMan_Again

【摘要】

：

【作者】

：

崔现伟

【机构】

：

北方工业大学

【出处】

：

北方工业大学

【发表日期】

：

2021年01期

【关键词】

：

预训练模型迁移学习数据扩充 Transformer BERT

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据时代的到来,计算机与移动网络的飞速发展。我们已经迎来了5G网络,人们获取信息的途径越来越多,每天数以亿计的信息留存于互联网上。丰富的信息资源在互联网上构建了一个大型知识库满足人们对未知信息的渴望。但是,庞大的信息量也让人们很难快速得到有价值的信息,如何快速筛选有价值的信息是当前亟待解决的难题。自动问答系统可以根据用户所提出的问题,自动挖掘问题的语义信息,并快速匹配得到问题的正确答案反馈给用户,解决人们难以快速高效获取信息的难题。本课题研究自动问答系统中的答案选择技术,答案选择任务定义如下:给定一个问题和一个候选答案集,对问题答案建模,通过训练深度学习模型让模型自动的筛选出问题的正确候选答案。本任务的关键是如何对问答答案建模,从而得到问题与答案的相似关系。目前主流的方法是采用以Bi LSTM为核心基于注意力机制的深度神经网络建模,但由于此类模型并不能获取文本中上下文相关的语义特征,所得到的语义信息量有限,此类深度学习建模方法准确率并不高。近年来,基于Transformer的预训练模型以其庞大的语义表达能力,在各大自然语言任务上大放异彩。因此,本文采用预训练模型用以研究答案选择任务。本文提出了一个基于预训练模型BERT微调的答案选择模型,并针对在答案选择任务上预训练模型的使用进行探索和尝试。对于分类器,本文采用全连接网络、DPCNN网络和Bi LSTM网络三种网络结构,探索对于答案选择模型不同分类网络的模型差异。此外,在不同维度上探索预训练模型在答案选择任务上的使用方法。针对预训练模型的训练方式,本文探索了基于Ro BERTa模型的迁移学习二次微调训练方法。针对数据量对预训练模型性能的影响,本文提出了一种基于信息检索的数据扩充策略。本文在三个数据集上测试了上述模型,实验结果表明本文提出的答案选择模型非常有效。其中,最优模型在Trec QA数据集上评价指标MRR、MAP分别达到了98.2%、94.9%。在Wiki QA数据集上评价指标MRR、MAP分别为93.5%、92.0%。在两个数据集中的排名均在前列。

其他文献

基于视频关注度的行人再识别方法研究

由于行人再识别其未来应用前景十分广泛,近年来一直是计算机视觉领域的研究热点之一。随着深度学习技术的发展,计算机设备性能的提升,越来越多的研究者已将关注点由基于图片的行人再识别转到基于视频的行人再识别。但是,在视频行人再识别领域,除了传统的光照、遮挡、视角变换与背景变换等问题之外,该领域还有另外一个重要问题,即输入数据量由单张图片变为多张图片组成的视频序列所带来的计算量倍增。如何在降低计算量的同时有

学位

视频行人再识别注意力随机擦除增强梯度中心化

臭氧发生器高频电源的鲁棒控制研究

臭氧是氧气的同素异形体,由三个氧原子构成,在常温下容易自行分解为氧气。同时臭氧具有极强的氧化性和杀菌能力,并且不产生二次污染,是一种优良的氧化剂和消毒剂。目前国内外学者对臭氧的理化特性和制备方法进行了深入地研究,取得了一系列成果,为臭氧的实际应用提供了坚实的理论基础。介质阻挡放电法（Dielectric Barrier Discharge）制备的臭氧产量大、浓度高,所以广泛应用于工业制备臭氧领域。

学位

臭氧发生器介质阻挡放电H<sub>∞</sub>控制器鲁棒控制高频

基于宽度学习的多模态情绪识别研究

情绪识别是近年来人工智能的一个研究热点,也是一个难点。人的情绪会通过面部表情、语音、身体姿态等不同模态表达出来。目前,有关静态面部表情和语音的情绪分类研究比较多,但基于面部表情及头部姿态的多模态情绪识别研究相对较少。课题研究了面部表情和头部姿态这两种模态的情绪表达特征,利用宽度学习（Broad Learning System,BLS）算法建立了基于这两种模态特征的情绪识别模型,并在公开的情绪视频数

学位

情绪识别模态融合宽度学习欧拉角

复合式无人机设计、建模与飞控硬件在环仿真

复合式VTOL无人机为最近比较火热的无人机机型,以其独特的四旋翼加固定翼的结构特点应用在诸多领域,复合式无人机结合了四旋翼和固定翼的特点,既可垂直起降,又可以进行平直飞行,大大减少了无人机对地形或者其它环境的依赖,其在最近几年得到快速的发展。由于复合式无人机近年来需求的增长,对复合式无人机的研究和制造就成了重中之重,直接利用一个实体无人机进行实验可以给我们最佳的反馈,但是由于极高的造价,导致我们不

学位

VTOL无人机PX4设计仿真垂直起降

下肢辅助运动装置控制系统研究

下肢辅助运动装置是一种便携式可穿戴智能设备,它将人的下肢与机器结构巧妙的结合起来,能够为人体提供支持保护,同时也能够辅助人体完成步行等行为。按照功能的不同,可以分为:致力于解决下肢运动能力丧失或者严重损伤患者的运动问题的康复类型的辅助运动装置和增强人体负载能力的辅助运动设备。本课题围绕下肢辅助运动装置控制系统进行研究,主要做了以下工作:（1）通过研究有关人体下肢辅助机器人文献资料,总结了下肢辅助运

学位

下肢辅助运动装置动力学模型模糊补偿控制迭代学习控制

网络化控制系统虚假数据注入攻击的设计与检测

网络化控制系统是将控制器、执行器与传感器通过通信网络连接起来的一种分布式控制系统,具有远程和大范围控制、便于安装和维护、移动性强等优点。由于通信网络特别是无线网络的开放性和保护不足,通过网络传输的数据很容易被窃取,甚至遭到恶意攻击者的破坏。因此,本文从控制安全的角度研究了网络化控制系统中虚假数据注入攻击的设计、检测和分析问题,主要研究工作如下:（1）针对网络化控制系统反馈通道测量数据和前向通道控制

学位

网络化控制系统虚假数据注入攻击攻击检测隐蔽性稳定性

基于深度学习的图像单类分类算法研究

图像分类旨在判断输入图像所属类别,是计算机视觉四大基本任务之一,单分类（one-class classification）是针对数据集中只包含一种类别样本的分类问题,在实际场景中的应用十分广泛。近年来随着深度学习理论的发展,许多优秀的分类网络被提出用来解决单类分类问题。但在实际应用中,分类器的分类效果常常会受到复杂背景、数据样本集小、目标在图像中的占比小等诸多因素影响,效果还不是很理想,基于深度学

学位

单分类AAE网络注意力机制生成对抗网络

基于图像的智能测量技术研究

网络购物时代的来临,使得物流运输业变得日益重要,日常小件货物的分拣、存放、运输等问题也越来越突出,其中必然会涉及物体的重量和尺寸信息。尺寸信息也就是物体的体积。如何智能化、自动化地获取物体的体积信息是亟待解决的问题。而已有的视觉测量技术,大多需要人工进行物体的定位检测、识别以及角点、边缘线等的提取,考虑到近年来深度学习理论在物体识别等方面的成功应用,本文以此为研究背景,系统探讨了在深度学习框架下利

学位

单目测量单应矩阵Mask R-CNN体积测量

基于模型验证的视觉跟踪算法

目标跟踪广泛应用于智能家居、医学诊断、交通视频监管等多个领域。随着相关滤波、深度学习的理论知识和计算机存储设备的迅速发展,判别式跟踪算法逐渐成为目标跟踪领域的主要发展趋势。判别式跟踪算法将目标跟踪问题转变成跟踪的目标与背景之间的二分类问题。因此算法先利用正负样本训练前景与背景的分类器,然后用该分类器在后续帧中找到最优目标区域。判别式跟踪算法的核心是目标定位、尺度以及速度三个问题,本文在判别预测模型

学位

视觉跟踪判别预测模型掩膜分割模型模型融合模型验证

基于深度学习的超分辨率方法研究

为了满足人们的精神文化需要,尤其是影音娱乐方面,超高清技术正处于大力发展阶段。但由于成像硬件设备的价格高昂,靠提升硬件来提高清晰度显然是无法大面积实行的。随着近些年深度学习的发展,依靠神经网络来进行超分辨率重构已经如火如荼,其不光成本低廉、便于部署,且重构效果已经超越了很多传统算法。超分辨率,其目标是从低分辨率图像中尽可能的恢复更多的细节信息,使图像变得更清晰,更容易被人眼所接受。针对单帧图像超分

学位

深度学习超分辨率摩尔纹去噪

基于Transformer的自动问答技术研究

其他学术论文