基于深度学习的电子病历命名实体识别

来源 :河北大学 | 被引量 : 0次 | 上传用户:caory
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术与医疗领域的结合,标志着传统医学向现代医学迈进。电子病历按照时间序列,详细的记录了患者在院期间疾病的发展全过程以及临床诊治情况。在电子病历应用上,我国规定辖区内的所有三级医院的电子病历应用水平需达到分级评价四级水平。随着电子病历系统的普及与推广,衍生出大量电子病历,如何利用病历文本信息,成为当下亟待解决的问题。通过对电子病历数据进行分析,不仅能够有效的改善医护人员临床记录质量,还能通过预置的临床实践规则,有效的提高临床决策水平,进而提高医疗质量。通过对电子病历文本的特点进行分析,从应用领域方面对中文电子病历命名实体的识别展开深入研究,采用深度神经网络进行电子病历命名实体识别。以下是本文的主要研究内容:(1)构建小规模电子病历语料库。本研究采用某医院提供的392份电子病历,通过对原始病历数据的摘取、整理、清洗和标注,构建了一个用于实验的小规模电子病历语料库。将自建语料库和CCKS2018公开数据集作为本文的实验数据集。(2)使用深度学习算法进行电子病历命名实体识别研究。分析电子病历的文本特点,选用CRF作为基线模型,在两组数据集上逐一进行了Bi-LSTM-CRF、IDCNN-CRF、Bert-Bi-LSTM-CRF、Bert-IDCNN-CRF多个模型的实验验证,在特征表示上用Word2vec技术和Bert预训练语言模型两种方法。根据实验结果,Bert-Bi-LSTM-CRF的结果均优于其他模型,故选择Bert-Bi-LSTM-CRF作为后续实验的基础模型。(3)提出改进的Bert-Bi-LSTM-CRF电子病历命名实体识别算法。分别将字典功能和汉字的部首特征集成到字符嵌入中,作为模型的输入,用以丰富语义的特征。实验结果表明,在Bert-Bi-LSTM-CRF模型的基础上增加新的特征,电子病历命名实体识别的F1值在两组数据集上的实验较Bert-Bi-LSTM-CRF模型均有提升。
其他文献
学位
随着我国“十四五规划”的提出,生态文明建设进而会致力于更大力度的自然生态环境修复、更高质量的生态环境保护治理和更加绿色的经济社会现代化发展。故本文以贵州红黏土地区生态护坡作为研究对象,在已有研究基础上,通过室内土工试验、护坡植物种植试验、植物根系分形理论、植物根系拉伸试验、根土复合体直剪试验、模拟降雨冲刷试验以及基于FLAC3D强度折减法的数值模拟,对贵州红黏土的物理性质、植物根系随生长时期的形态
本文主要研究具依赖于时间阻尼的拟线性双曲方程Cauchy问题整体光滑解的存在性和收敛率.关于具阻尼的拟线性双曲方程的研究,前人的结果主要集中在常数阻尼的情形,本文主要研究依赖于时间的阻尼,阻尼项为μ/((1+t)λ)Vt,其中-10时,阻尼项μ/((1+t)λ)Vt的影响是依赖于时间渐近退化;而当-1<λ<0时,阻尼项μ/((1+t)λ)Vt的影响是依赖时间渐近增长.
质子交换膜燃料电池(PEMFC)被认为是未来最有前途的动力源设备之一。双极板充当燃料电池堆中各单电池的连接组件,同时输送反应物排出生成的水,还起到收集电流和支撑膜电极的作用,因此双极板流场的优化研究广受关注。本文首先使用单相假设的计算流体动力学(CFD)模型仿真分析了4种不同弯管处布置和流向的蛇形流场PEMFC;并在此基础上比较了基于两相流的蛇形流场PEMFC在中高电流密度工况下的不同性能体现;最
学位
大长径比固体火箭发动机因推力大,装药量大,续航性强可以满足现在众多导弹的军事要求,所以大长径比发动机在我国的航天领域中占有重要的地位。但是大长径比固体火箭发动机,随着工作时间的增加发动机内的燃烧稳定性会变差,尤其在发动机的工作末期出现一些反常的燃烧现象,使发动机产生剧烈的振荡,甚至会损坏发动机。通过对大长径比固体火箭发动机进行不同的翼柱装药位置时的压力衰减振荡的对比、不同推进剂和不通几何结构时的增
近年来,随着信息科学技术的不断发展,生物识别技术的应用也越来越广泛。其中,步态识别由于其具有非受控识别、远距离识别以及难以伪装和发现等特性,已经成为了学术界研究的热点领域。然而,步态识别也面临着很多的问题,由于人在三维空间中行走,服装变化,以及走路时与摄像机视角的变化都会对人走路的外表造成很大的影响,造成识别准确率下降。在此背景下,本文从度量学习的角度出发,提出一种结合基于分类损失和基于距离损失的
随着金融市场的发展,银行业的内部控制问题也随之凸显,行业竞争日渐激烈,利润空间不断缩小,银行的贷款不良率却随着经济下行而不断上升,控制不良率,提升经营利润和经济利润是各银行争相追求的经营目标,而提升经营效益的关键点之一就是通过对信贷内部控制机制的优化来保障信贷资产质量,从而控制不良信贷增长,在不断变化的市场环境里提高抗风险的能力,促进银行的持续平稳发展。本文以CN银行B分行作为研究对象,以其信贷风
学位
大数据时代对通信网络信息的储存、处理和传输提出了更高的要求,硅基光子集成电路凭借其小体积、低损耗、多功能、大带宽、抗干扰和相兼容等优点获得越来越多的青睐,光电混合集成系统成为未来的发展趋势。功率分束器是光子集成电路中重要的组成部分,它可以实现多通道的功率分束,对处理片上光信号具有重要的应用。但是,人工搜索少量设计参数的传统方法实现的光子器件尺寸较大,不利于高密度的光子集成电路,且其设计过程具有一定