【摘 要】
:
近年间得益于强大的硬件计算性能和深度学习的蓬勃发展,以BERT为代表的自然语言模型陆续登上舞台,其在GLUE、SQu AD和RACE等自然语言处理测试任务集上取得了SOTA的优异成绩。与此同时,在通用领域上取得优异成绩的BERT模型却因受限于预训练过程中的语料规模,训练过程中缺少专业领域的事实知识,导致其准确度性能在专业领域中受到限制。目前已有学者提出知识增强型BERT模型,通过引入外部专业知识改
论文部分内容阅读
近年间得益于强大的硬件计算性能和深度学习的蓬勃发展,以BERT为代表的自然语言模型陆续登上舞台,其在GLUE、SQu AD和RACE等自然语言处理测试任务集上取得了SOTA的优异成绩。与此同时,在通用领域上取得优异成绩的BERT模型却因受限于预训练过程中的语料规模,训练过程中缺少专业领域的事实知识,导致其准确度性能在专业领域中受到限制。目前已有学者提出知识增强型BERT模型,通过引入外部专业知识改善模型在不同领域下游任务中的知识缺失问题,取得比原始BERT模型更高的准确率。但由于知识增强型BERT通过引入大规模外部知识对模型进行增强,导致模型对计算资源需求和训练时间急剧攀升。并且通过向BERT模型引入外源知识的提升其知识认知水平的同时,也存在对引入外源知识学习不充分的问题,在此过程中信息噪音也会影响模型的稳定性与泛化能力。针对上述提出的问题,本文主要研究的是快速引入外源知识的知识增强方法和增强模型事实知识认知和泛化能力的知识增强方法。首先,本文研究了学术界中利用知识图谱对BERT模型进行知识增强的技术实现,并提出基于文本关联语料生成的知识增强方法。文中通过公式对文本关联语料生成方法进行描述,并在时间复杂度上推理证明其对比传统方法具有明显速度优势。然后设置实验对基于文本关联语料生成方法的BERT模型进行准确率性能测试,并与其他相关模型方法进行比较。实验结果表明该方法能在引入外源知识的同时,充分降低为BERT模型引入外源知识的计算资源代价,分别在知识引入与训练阶段平均减少了53.5%与37.4%的计算耗时。其次,为进一步提升BERT模型利用外源知识的能力及减少其训练过程中的过拟合现象,本文提出使用增量学习任务d EA及梯度优化算法Child Tuning F对模型进行调整。d EA任务通过利用原有的BERT模型任务及结构,联合外源知识库提供的知识实体对模型进行增量学习训练。同时,通过修改优化器对模型训练过程实现梯度计算的优化操作,该优化算法在理论推算上证明了其可有效的提升模型的泛化能力。最后在实验中验证了联合增量学习与梯度优化的知识增强方法能有效的进一步提升模型的精度性能,在实验中准确率对比BERT平均提高1.87%,同时减缓了模型在下游任务的小规模数据中过拟合现象。最后,在项目实例中应用BERT模型构建了智能问答系统的核心模块,通过知识图谱提供的外源知识和前述的两种知识增强方法对BERT模型进行知识增强,强化其在专业领域的知识认知能力,提升了其在专业领域任务上的准确率性能。随后在专业领域数据集中进行实验验证,经实验证明两种方法知识增强后的BERT模型较原始版本提升10.07%的准确率性能,最后在真实场景中验证智能问答系统的有效性。
其他文献
近年来,空气质量受到广泛关注,对于保护居民健康至关重要。其中细颗粒物(PM2.5)与大气环境和人类生活息息相关。受到设备性能和部署成本等因素影响,城市中PM2.5监测站数量有限,无法提供细粒度PM2.5浓度。如何根据现有监测站推断、预测和校准没有监测站地区PM2.5浓度对于居民身体健康和城市规划建设等方面具有重要意义。本文获取了空气质量监测站、遥感和气象等数据,将研究区域分为相同大小的网格,对半监
本文研究了量子信道的纠缠检测。通过将信道纠缠与对应的Choi态的纠缠相关联,实现了利用量子态纠缠检测方法类似地构造信道纠缠检测的方法。基于两体量子态纠缠检测的三种纠缠目击者算子,本文构造了三种信道纠缠目击者算子。此外,本文将这三种信道纠缠目击者算子用于检测有噪声的由CNOT(控制非门)或者SWAP(交换门)组成的两体量子线路的纠缠,并比较了它们的性能。从结果来看,这三种算子可以成为两体量子信道常规
互联网平台的迅速崛起为民众提供了发表观点的场所,评论文本中蕴含着丰富的主观情感倾向,文本情感分类研究受到广泛关注。目前,深度学习技术凭借优秀的特征捕捉能力,逐渐成为文本情感分类研究的主流方法。然而,部分基础模型特征提取能力单一,导致特征表示不够全面。同时,复杂的模型结构意味着繁琐的参数调节过程。针对深度学习方法存在的问题,本文以文本情感分类任务为切入点,构建基于混沌狮群优化的情感分析模型和多尺度语
无线传感器网络作为一种新型的监控方式,可对周围环境进行监测和数据采集,是物联网的重要组成部分,已广泛应用于各个领域。由于无人机具有易部署、灵活性高、机动性强等特点,使用无人机收集传感器监测的数据可以减少延迟,增强无线传感器网络的可持续性。然而,无线信道的广播特性增加了无线通信被窃听的风险。为使监测数据和敏感信息不被泄露,无线通信的安全问题必须得到保障。然而,现有工作在保护无线通信安全的同时均未考虑
智能规划是人工智能研究的主要领域之一,其使用自动化的过程处理现实中的规划和调度问题。随着规划问题的不断复杂化,出现了具有不确定性因素的规划问题。这类问题很难使用原有的智能规划技术求解,这时就出现了概率规划。概率规划作为智能规划的一个分支,弥补了智能规划在求解不确定性问题方面的不足,并逐渐成为研究的热点。概率规划能很好的支持动作的并行性和动作的不确定性。但这些特性会导致随着状态变量个数的增加,状态数
在共乘场景中,具有相似出行路线和相近出行时间的多名乘客一同出行,能降低出行的成本和缓解交通拥堵。同时,减少实际所需的车辆数目能减少用于交通运输的能源消耗。然而现有的共乘研究大多忽略了提供接载服务的车辆的收费标准不一致对乘客出行服务质量的影响。本文针对共乘平台能实时接收共乘出行请求的场景,研究司机与乘客之间的匹配问题。由于司机与乘客双方都存在策略的选择,本文将双方的匹配过程构建为一个主从博弈的过程。
针对一类电磁感应现象的独特过程(自感现象的暂态过程)给出了教学实施案例和简要评析,以期给同行参考。
单张图像超分辨率(Single Image Super-Resolution,SISR)是根据低分辨率图像重建高分辨率图像的操作,是计算机视觉方向里一个重要分支。它也是医学图像、监控和安全等实际领域被广泛使用的图像处理手段。图像超分辨率既可以增加图像的视觉效果,也可以在其他计算机视觉问题中,提高程序的性能。在最近几年,由于深度学习的进步,由深度神经网络构建的图像超分辨率模型得到了积极探索。这些图像
近年来,许多新兴的应用基于深度神经网络为移动终端提供视频分析服务,例如增强现实、人脸识别、智能摄像等等。然而,这类应用通常需要大量的计算资源以提供支撑,远超终端设备的处理能力。将视频分析任务卸载到云端/边缘服务器是近年来解决该瓶颈的一个研究方向。上述研究方向有如下两种研究视角:从终端的视角出发,需要研究视频帧的传输配置,例如分辨率、码率和采样率等等,以最大化该终端能够获得的视频分析精度;从视频分析