基于深度学习的中文电子病历命名实体识别研究与应用

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:chenwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历包含大量的医学信息,并日益引起了人们的广泛关注。在海量电子病历数据中蕴藏着大量重要的医学领域实体信息,这些实体对于医学中特殊疾病的研究有重要的帮助。但是,由于电子病历信息属于非结构化信息,大量实体散落于杂乱的信息中,无法被机器直接进行鉴别和应用。所以,通过自然语言处理方法对中文电子病历信息进行智能处理已成为当前医疗数据信息抽取的一种主要发展趋势。命名实体识别是信息提取的重要组成部分,主要研究非结构化文本中对特定名词的识别。通过研究国外有关研究背景与发展成果,对基于深度学习的中文电子病历命名实体识别方法展开了深入研究与探索。重点研究与探索内容包括:(1)为了提高所抽取电子病历文本中语义信息的准确性,提出了RoBERTa-WordBiLSTM-CRF命名实体识别算法。该算法首先采用预训练模型RoBERTa得到充分考虑上下文信息的字向量;然后对文本进行分词处理,再通过向量表示得到词向量;最后将两者进行融合传入双向长短记忆神经网络BiLSTM中进行训练,经过条件随机场CRF进行预测输出。在CCKS-2019电子病历数据集上进行的对比实验表明,在采用三个评价指标的情况下,本文算法均明显优于经典的电子病历命名实体识别方法。(2)常见的命名实体识别模型的编码层通过BiLSTM网络进行语义特征获取,不能获得比较全面的局部特征。为了进一步获得语义特征信息,对RoBERTa-WordBiLSTM-CRF模型的编码层做出了改进,提出结合IDCNN和多头注意力机制的命名实体识别模型。该模型在编码层引入多层空洞卷积的IDCNN模型来获得更加语义丰富的局部信息,再引入注意力机制赋予语句中关键词更多的权重,起到突出关键词作用。在CCKS-2019数据集上进行实验对比,验证了模型的性能。(3)为了更好地将改进后的命名实体识别算法应用于医疗领域,帮助医疗人员从非结构化电子病历中获得实体信息,构建了一个界面友好、操作简单的中文电子病历命名实体识别系统。通过该系统能够进行电子病历数据集扩充、模型训练、电子病历命名实体识别等功能。
其他文献
第一部分RIPK3小分子抑制剂的设计、合成及构效关系研究程序性细胞坏死(Necroptosis)是由死亡受体介导的、不依赖于Caspase蛋白水解酶的一种细胞死亡方式,主要由受体相互作用蛋白激酶1(RIPK1)、受体相互作用蛋白激酶3(RIPK3)和MLKL蛋白(mixed lineage kinase domain like protein)等调控。程序性细胞坏死会诱发细胞周围的炎症反应,并导致
学位
<正>9月21日,省委书记林武深入中条山集团进行调研,历史、客观、辩证地对中条山企情进行深入分析和把脉,为中条山集团铜产业高质量发展指明前进方向。铿锵话语鼓舞人心,使命任务催人奋进。中条山集团将把学习宣传贯彻党的二十大精神,与企业中心工作紧密结合起来,提升战略思维,明晰发展思路,本着对党负责、对企业负责、对全体干部职工负责的态度,力争把各项目标推进好、实现好。
期刊
大数据技术在市政城市道路养护中的应用,有利于推动智慧城市的建设,提高城市管理和规划的科学性。本文深入分析了在大数据背景下的市政城市道路养护管理工作的重要性、特点以及存在的问题,并针对各项管理问题,提出了相应的解决措施,希望能够对我国的智慧城市建设有参考意义。
期刊
物流运输是企业的“第三利润源”,而运输方式的选择是运输环节中最重要的一环。W造船企业中所需原材料由于技术不成熟、需求定制化等原因大多为欧洲进口,且进口原材料大多为大体积定制化货物,不仅对运输成本和运输时间要求较高,更是对物流运输的运输风险以及可靠性、便捷性有着相比于其他制造业更高的要求。当下受到疫情和欧洲动荡局势的双重影响,导致运输成本居高不下,提高了船舶建造的完全成本。因此,如何根据运输原材料的
学位
2020年9月,我国在联合国大会上首次提出了“双碳目标”,在该政策的指引下,国务院发展中心和汽车工程学会在“2020汽车蓝皮书”发布会上提出汽车行业须严格贯彻并争取提前实现双碳目标。这就意味着新能源汽车行业在未来一段时间将迎来更大的发展机遇,但也面临着更为激烈的市场竞争,而应对激烈市场竞争的法宝之一就是加强企业营运资本管理绩效评价,提高企业营运资本管理水平。因此,构建适用于新能源汽车制造业的营运资
学位
学位
互联网的迅速发展和应用普及为用户获取信息提供了便利,但同时由此造成的信息过载也给用户有效使用信息带来了困扰。推荐技术的快速发展和推荐系统的广泛使用为用户高效获取信息提供了有效保障。然而,传统的单域推荐方法通常面临数据稀疏性和冷启动问题。近年来,由于跨域推荐算法可以利用不同领域的知识来解决这些问题,因此受到了越来越多的关注。虽然现有的跨域推荐算法在许多应用场景下都能取得良好的推荐效果,但是大多数跨域
学位
<正>习近平总书记在党的二十大报告中强调指出:全面建设社会主义现代化国家、全面推进中华民族伟大复兴,关键在党。必须持之以恒推进全面从严治党,深入推进新时代党的建设新的伟大工程。学习宣传贯彻党的二十大精神,既是当前一项重大的政治任务,也是全方位推动国企高质量发展的根本遵循。近年来,山西焦煤集团党委在推进企业改革变革中,
期刊
<正>党的二十大报告提出,推进文化自信自强,铸就社会主义文化新辉煌。山西焦煤集团始终坚持以习近平新时代中国特色社会主义思想为指引,把握发展趋势、顺应职工需求,积极建设具有新焦煤特色的新文化,以文化落地助推企业全方位高质量发展。一、提高政治站位,深刻认识推动文化落地的重要意义管理学中有一个流行说法:三流企业靠人管理;二流企业靠制度管理;一流企业靠文化管理。对于山西焦煤这样一个拥有20多万职工的大型国
期刊
原位自生颗粒增强铝基复合材料具有比强度高、密度小、热膨胀系数低等优点。与非原位铝基复合材料相比,原位自生铝基复合材料中的增强颗粒是通过化学反应的方式在铝基体中形核并生长,增强颗粒与基体结合界面洁净。然而,铸态原位自生铝基复合材料不可避免出现颗粒偏聚、晶粒粗大、气孔等铸造缺陷,使得原位铝基复合材料的力学性能难以得到明显改善,常规的二次加工技术(如轧制,挤压等)对于铸造缺陷消除以及晶粒细化起到明显作用
学位