融合知识的预训练模型在阅读理解中的应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yyy_chj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,许多领域都出现了人工智能与传统行业的深度融合,诞生出了各种改变人们日常生活的应用。医疗作为与民生密切相关的领域,人工智能与医疗进行深度融合必然能够极大地提升人民的生活水平,因此将人工智能深度赋能医疗吸引了许多研究人员、政府人员和企业人员的关注。互联网上丰富的医疗信息和不断发展的自然语言技术,使得对医疗信息的挖掘和应用成为可能。本文针对融合知识的预训练模型在阅读理解中的应用这一课题,首先分析了现有的预训练模型在进行医疗领域迁移的过程中遇到的知识壁垒问题,然后分别从融合知识图谱结构化知识的预训练模型和融合文本非结构化知识的预训练模型两种方法进行研究。最后本文面向实际医疗问答场景,对该系统的检索、抽取、排序三个模块分别进行了研究。在融合知识图谱中的结构化知识的实验中,本文首先提出了两种预训练模型融合结构化知识的方法,一种是基于文本增强的知识融合方法,一种是基于图表示增强的知识融合方法。最后实验验证了基于文本增强的知识融合方法相比于BERT模型取得了较大的提升,基于图表示增强的知识融合方法在本文的模型结构下也有一定的提升。在融合文本非结构化知识的实验中,本文的核心思路就是通过掩码语言模型任务,让模型在大规模的医学文本上预训练,学习到文本中蕴含的隐式知识。本文首先介绍了本文使用的BERT模型的结构,然后提出了三种掩码任务——单字掩码,整词掩码,实体掩码,最后进行实验证明了实体掩码的效果优于整词掩码优于单字掩码。在对医疗问答系统的设计中,整套系统分为三个模块——检索,抽取,排序。本文首先介绍了基于BM25算法的检索器,然后本文使用第2章和第3章中训练得到的预训练模型进行阅读理解任务,并选取最好的模型作为系统的抽取模型。最后本章提出了面向候选答案的基于自注意力机制的排序模型,然后分析了答案上下文对于答案排序的重要性,提出了结合文档和答案的排序模型,实验表明两步改进都提升了最终的排序性能。
其他文献
光场显微技术作为一种无需扫描、可伸缩的方法,可以以高分辨率观察跨越多个时空尺度的各种解剖和功能信息,从而实现从单细胞标本到哺乳动物大脑的高速、体积成像,但重建伪影的出现和复杂的计算成本大大限制了光场显微技术的广泛应用。因此研究人员通过两个方面对光场显微系统不断进行优化和改进。一方面通过调整微透镜阵列的相对位置,得到了较高分辨率的光场显微镜,并有效避免了重建伪影;另一方面,通过将微型显微镜平台和光场
近年来,我国在电力系统建设上的投入不断增加,电网覆盖范围也越来越广,随之而来的是输电线路舞动事故发生频率逐年攀升。舞动已经成为造成电路安全隐患的主要原因之一,并成为各国研究焦点问题。使用输电线路舞动监测技术可以得到输电线舞动的关键参数,这一点对于研究舞动产生机理以及分析影响舞动因素就尤为重要。输电线路舞动监测技术有诸多解决方案,其中,基于视频采集的监测技术凭借其非接触测量特性,可以较大程度地省却安
为了提升高功率激光装置中大口径光学元件的初始损伤检测与跟踪能力,针对光学元件损伤暗场图像的纹理信息少、关键信号微弱的问题,提出基于模型集成的暗场图像超分辨率重建方法,对早期发现光学元件损伤具有重要意义。本文主要研究内容如下:(1)对图像超分辨率重建方法进行系统综述,分析了从传统的基于插值法到目前的基于深度学习法的图像超分辨率重建技术原理和特点;(2)提出一种基于模型集成的暗场图像超分辨率重建方法,
由于“大跃进”和农村人民公社化运动的失误,加上1959—1961年连续三年自然灾害和苏联政府背信弃义地撕毁合同,使我国国民经济陷入困境,国家和人民遭遇重大损失,农村生产力遭到破坏,农业产值特别是粮食产量连年减产,人民口粮出现供应紧张的状况,部分地区出现严重饥荒。粮食成为影响全国人民群众最突出的问题。1960年代初的农业困难引起了整个国民经济困难,党中央为了战胜困难,走出困境,1960年8月10日中
基于知识库的问答系统能够针对用户提出的自然语言问题直接作答,相比于借助形式化查询语句获取知识库内容的方式,问答系统更加智能且高效。依托于大规模知识库的问答系统通常采用流水线工作模式,在这种模式下,系统利用自然语言处理的相关技术确定问题查询的主题实体,并在知识库中抽取主题实体相关的三元组,从中找到与问题相关度最高的组合用以抽取问题的答案。知识库中相互关联的三元组表现为小规模的图结构,这种结构被称为查
随着近几年来自然语言处理技术的迅猛发展,人工智能已经渗透到我们生活的方方面面,各种各样的人工智能产品出现在市场上,人们也逐渐对计算机寄予了越来越高的期望,希望计算机能够帮助人们完成更多更复杂的工作。得益于深度学习和大数据的发展,一些任务导向的对话语音助手也渐渐在人们的日常生活中出现。这些对话语音助手,不仅可以陪用户闲聊,还可以智能化地解决人们很多日常需求,比如听音乐、打电话、订车票等。其背后的主要
随着监控/摄像头覆盖率的不断提升,人们可以越来越方便快捷的获得大量的视频信息,比如课堂视频,小区门岗监控等。传统的依靠人工进行的监察、判断手段缺点越来越明显:观看视频效率低、速度慢;人的注意力容易不集中;人工手段成本过高等。而通过人工智能技术的动作识别算法在复杂的环境下又会出现识别率过低,识别结果不可信的问题。本文使用深度学习技术进行视频的自动识别分析。通过对视频中人物的关节点识别+动作识别来获得
随着互联网与多媒体技术的不断发展,数据传输日益便捷,由此引发了许多侵权、恶意攻击以及盗版等问题,数字水印技术在版权保护方面就显得尤为重要。虽然电子文件逐渐取代了纸质文档,但仍有许多重要文件例如证件、证书、书本等需要制成印刷品,水印的抗打印扫描攻击能力在版权保护中也十分重要。目前,许多学者选择在更不具有可见性的频率变换域中进行水印嵌入,然而在图像频域嵌入水印存在着难以平衡水印隐藏性、鲁棒性以及嵌入容
语义分割是像素级的图像分类任务。相比于其他的计算机视觉任务如图像分类和目标检测而言,语义分割能够提供更加丰富的语义信息。随着深度学习在近些年来的迅猛发展,基于深度学习的语义分割算法已经在自动驾驶、缺陷检测、智慧农业和医疗图像分析等领域拥有了广泛应用。但是目前基于深度学习的语义分割算法的计算量往往都很大,这限制了算法在资源有限的嵌入式设备等平台上的应用。本文首先分析了现有的基于光流法的视频语义分割模
三维重建是三维视觉领域重要的研究分支之一。随着高性能深度传感设备与相关传感技术的飞速发展,三维重建领域吸引了学界越来越广泛的关注与研究,其在自动驾驶、虚拟换装等新兴领域中均具有广阔的应用前景。其中,虚拟换装是随着近年蓬勃发展的电子商务而逐渐兴起的技术。消费者可以通过在虚拟模型上直接进行服装更换来了解试穿效果,以获得更可靠的购物体验。本论文借助深度摄像设备对用户进行采集,并基于得到的点云数据展开三维