基于MIMIC-Ⅲ数据库的心衰患者诊断与再入院模型研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:wangluochg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
心力衰竭,简称心衰,是心脏疾病发展的终末期。尽管近年来深度学习方法在医学领域得到广泛的关注,但想大规模地分析电子健康记录(EHR)数据,仍具有极大的挑战性。在大量医学文本中,及时识别心力衰竭患者并建立再入院预测模型,可以使临床医生采取正确的治疗从而防止患者病情恶化、减轻患者费用负担。本文利用MIMIC-Ⅲ公开数据库的非结构化数据进行心衰疾病诊断和再入院预测的研究。相比于结构化数据,会包含历史疾病和家族疾病等更为丰富的患者信息,但同时存在口语化词汇多,内容稀疏等问题。因此,以解决上述问题为出发点,MIMIC-Ⅲ公开数据库中非结构化数据为实验支撑,搭建深度学习模型,对心衰患者进行诊断研究并进一步判断心衰患者的再入院情况,从而使心衰患者的治疗过程更加及时高效。本文主要工作如下:(1)MIMIC-Ⅲ数据库中可用于研究的心衰患者为10270位,同时,数据库中的心肌梗死患者和高血压患者,分别为4464位和17644位。进一步,针对心衰患者再入院的研究,将提取的10270位心衰患者以不再入院、30天内再入院和30天后再入院三个研究类别进行划分,分别得到6948位、747位和2575位患者。(2)针对心衰患者的诊断搭建模型,首先使用词频-逆词频(TF-IWF)模型和潜在狄利克雷分配(LDA)模型分别从医学文本中提取关键字集和主题词集,完成病历文本内容表示上的扩展,最后应用改进的Bi RNN模型,即嵌入全局注意力机制和门控机制两个模块,将改进的分类器命名为Gated-Attention-Bi RNN(GA-Bi RNN),从海量医学文本中识别心力衰竭。本文结果表明,提出的KTI-RNN模型F1分数为85.57%,准确率为85.59%。在医学文本特征扩展的基础上,不仅克服了内容稀疏的问题,还通过改进的分类器,取得良好的分类效果,从而辅助医生进行心衰诊断。(3)使用提出的M-BERT模型对心衰患者再入院进行预测,即在BERT模型的embedding上加入对抗训练FGM模型。结果表明,本文提出的M-BERT模型对于心衰患者不再入院的F1分数为87.15%,准确率为85.98%;对于心衰患者30天内再入院的F1分数为84.80%,准确率为83.24%;对于心衰患者30天后再入院的F1分数为86.01%,准确率为86.14%。M-BERT模型的预测效果明显优于传统的深度学习模型。使用MBERT模型可以辅助医生判断,使治疗过程更加及时高效,从而降低心衰患者再入院率。
其他文献
宋代是婴戏图发展的巅峰时期,婴戏图画作将描绘的主体聚焦在儿童身上,围绕儿童的游戏、模仿活动、学习等日常生活场景进行刻画。宋代婴戏图具有院体画精细写实的特点,详尽刻画了儿童服饰,其形制丰富,纹样精美清晰可见,色彩明丽典雅,代表了宋代对于儿童服饰的审美取向。相对于婴戏图的繁盛,宋代儿童服饰的文献记载和出土文物寥寥无几,因此宋代婴戏图成为研究宋代儿童服饰的有力证据,具有较高的艺术价值和研究价值。本文以宋
学位
在室内复杂环境下,基于WiFi的人体轨迹追踪可以实现用户在不接触任何硬件设备的情况下,通过简单的手势来控制智能设备。并且可以通过对人体部位识别和移动轨迹的捕捉,来完成根据人的行为制定对智能设备的控制。人体轨迹追踪的研究促进了用户监视和人机交互的发展。人体轨迹追踪在智慧家居、老年人健康检测和入侵者检测等方面具有很好的应用。为了实现在复杂的室内环境下完成人体轨迹追踪,设计了联合动态参数估计(Joint
学位
命名实体识别是自然语言处理的关键技术之一,可以有效识别信息中各种类型的实体,同时也为其他下游任务提取主要信息奠定了一定的基础。传统的命名实体识别方法主要包括基于人工设定规则的方法、以聚类为主的无监督学习方法和基于特征工程的有监督学习方法。这些方法对人工设计规则或特征提出了很高的要求,而且面对新的数据集或领域,原来的模型往往无法直接迁移。基于深度学习的命名实体识别模型可以自主发现任务所需特征,而且相
学位
在变电站等复杂电力场景中,巡检人员与危险设备的空间距离感知是人员安全管控任务的基本问题,对人和设备进行精确定位与识别是提高人员安全管控水平的前提。随着激光雷达和3D视觉理论的发展,3D点云目标检测可为下游空间距离度量任务提供必要的技术支撑。因此,论文开展基于3D视觉的电力环境异常检测与空间距离感知研究的课题,针对电力巡检环境提出实时与非实时的变电站场景巡检人员与带电设备的高精度检测方法,并提出本文
学位
为研究2022冬奥会期间减排措施对北京大气颗粒物粒径谱分布特征的影响,于2021年12月1日~2022年3月28日使用扫描电迁移率粒径谱仪(SMPS)对粒径为3~660nm的大气颗粒物的数浓度谱分布进行了实时监测,结合气态污染物和气象参数,对比分析冬奥会前后新粒子生成(NPF)日和非新粒子生成日的颗粒物数浓度及粒径分布特征.结果表明,大气颗粒物数浓度随减排措施的加强而降低,冬奥会期间(2022年2
期刊
可持续能源转换和存储技术已被公认为传统化石燃料能源的替代品,可适应全球气候和环境变化挑战。这些可持续能源装置的电极反应动力学缓慢,特别是燃料电池和金属空气电池阴极中发生的氧还原反应(ORR)已成为严重限制其实际应用的整体效率的瓶颈。因此,必须使用高效的催化剂来实现此类装置的低能量屏障运行。铂族金属(PGM)被认为是ORR活性最高的催化剂,但如何设计高活性、低铂(Pt)用量的PGM催化剂仍是当前的研
学位
路面损坏的智能检测技术能够有效提高路面巡检质量和效率,对保障公路交通安全具有重要的作用。常见路面损坏主要集中在各种类型的路面裂缝及坑槽等。而且,不同类型的路面裂缝在识别时具有一定的困难,主要由于裂缝类型多样、裂缝形状不固定以及路面裂缝背景复杂等因素。在此背景下,围绕公路路面损坏自动化检测技术展开研究工作能够更好地保障交通安全和稳定,助力我国公路系统的日常巡检工作。本文中,从车载相机拍摄的路面巡检图
学位
红绿彩瓷作为陶瓷产品的一种,经历了快速的艺术发展,其色泽靓丽而又质朴无华。不仅与同一时期的其他陶瓷之间存在着千丝万缕的联系,还在构图和装饰方面有着互相借鉴及影响。本文以收集到的红绿彩陶瓷图像资料为研究基础,通过发掘出土和存世的红绿彩陶瓷实物以及相关的历史文献,对所搜集到的图像资料进行详细分类,并添加于附录。通过考古类型学、设计艺术学、田野调查等研究方法,首先按照其工艺特征、艺术特征和流变、以及与其
学位
毛坪铅锌矿(化)带主矿区浅部资源已基本查明,深部及外围矿产勘查有待进一步加强。本文在收集矿化(带)前期研究成果及矿山近年勘查资料基础上,综合研究分析已查明矿(化)体特征、构造,矿(化)带所处花苗寨背斜被洛泽河断裂分为河东、河西矿段,其中河东在构造叠加作用下,西翼地层倒转陡倾形成走向、倾向均较大的斜列对称有利赋矿空间,推测已查明矿体深部斜对称部位及毛坪断裂切穿褶皱部位具有较好找矿潜力;河西背斜由北东
期刊
糖尿病性视网膜(Diabetic Retinopathy,DR)是一种由于糖尿病而引起的眼部疾病,是糖尿病并发症中易发病变类型之一。如果患者不能及时接受治疗,那么视网膜将受到不可逆转的伤害。但目前我国眼部检查设备以及专业医生都相对紧缺,为了缓解医生接诊压力,设计DR准确分类模型具有重要临床意义。近年来利用深度学习进行DR病变筛查已经成为研究热点,然而由于数据集质量参差不齐以及深度学习缺乏直观解释的
学位