肺炎患者的死亡预测及评分研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:yorehi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化技术与医疗领域结合的深入发展,临床医疗相关数据的挖掘与应用逐渐成为热点研究领域。相对于普通病房而言,重症加强护理病房(ICU)的患者数据在数据的种类和标准化上的质量都更高,更有利于根据患者的医疗数据进行研究与分析。本文的研究是基于MIMIC-Ⅲ重症监护数据库展开的。首先对MIMIC-Ⅲ数据库做了探索性分析。接着,按照《国际疾病与相关健康问题统计分类》第九版(ICD-9)对疾病的定义和分类,从MIMIC-Ⅲ重症监护数据库出发,确定未指明肺炎患者为本文研究对象,参考相关医学文献从数据集中选择并提取变量构建数据集。在建模之前,对数据集进行预处理,将各变量的时间序列型数据以最大值、最小值以及均值的形式代替,从而降低数据复杂程度,简化数据结构。将样本量为2606、以患者是否在医院内死亡为标签、包含121个变量的原始数据集按照7:3的比例划分为训练集和测试集,采用中位数、均值、随机森林填充缺失值的方法处理数据集,在训练集上分别建立随机森林、XGBoost以及Light GBM模型,运用10折交叉验证的方法综合对比模型的评估指标,选出性能最佳的XGBoost模型作为未指明肺炎患者的死亡预测模型,模型的查全率为0.7325、F1的值为0.7976、AUC的值为0.9554。再基于树模型的属性,选出特征重要性在规定阈值以上的19个变量,这些变量在死亡预测模型中具有很高的贡献。医护人员可以通过对患者各变量及时的监测和记录,将数据反映给专业的数据处理人员,通过未指明肺炎患者的XGBoost死亡预测模型对患者的情况进行预测,从而辅助医护人员进行临床诊断,分配医疗资源。虽然集成模型的预测效果比较理想,但是树模型在对变量的分析上存在不足,因此从可解释性比较强的逻辑回归模型出发,对未指明肺炎患者进行进一步地研究和分析。首先确定训练集中各变量的最佳分组数,计算变量在不同分组下的证据权重(WOE),通过WOE的值可以比较明确地解释当前变量与标签的关联,特别是当变量与标签呈非线性关系时。计算各变量的信息值(IV),筛选出IV值大于等于0.1的102个变量,将这些变量经过WOE值变换后建立逻辑回归模型,筛选显著的变量后,最终建立的模型的查全率为0.7143、F1的值为0.7232、AUC的值为0.9103。基于逻辑回归模型的参数,进一步地建立患者的预警评分模型。对预警评分模型的效果进行秩和检验与PSI检验,检验结果认为该预警评分模型对患者死亡率风险的拟合效果良好。再根据不同分数区间下患者的死亡率情况将患者进行划分,设定5个不同的风险等级。也就是说,医护人员可以通过观测阴离子间隙、镁、总胆红素、红细胞分布宽度、葡萄糖、血氧饱和度、天冬氨酸转氨酶、碱剩余、心率、血二氧化碳分压、白细胞、白蛋白、血小板、嗜中性粒细胞、无创收缩压、单核细胞以及体温这17个变量的情况,计算患者的评分,根据患者所处的等级判断患者的情况,从而指导医护人员对患者实施救治及护理措施。总的来说,本文针对未指明肺炎患者进行了两部分研究,分别是根据XGBoost构建的死亡预测模型与基于逻辑回归方法构建的预警评分模型。前者的预测效果无论从查全率还是AUC的值来说都更高,但是当需要更直观地解释变量情况时,逻辑回归模型的效果更佳。两者都具有一定的实际意义,是对未指明肺炎患者相关研究的补充。
其他文献
图像噪声影响人们对图像信息的分析以及后期的图像处理工作,因此图像去噪算法的研究具有非常重要的实际应用价值。近年来,随着大数据的兴起和GPU性能的提升,深度学习逐渐成为图像处理领域的主流,也给图像去噪带来了新的理论支持和应用支撑。理论上基于深度学习的去噪算法有着强大的自学习能力,去噪效果相对于传统去噪算法会更好。为了探究深度学习算法的去噪效果,本文对深度学习去噪算法和传统去噪算法进行了仿真实现,并基
学位
石油作为一种不可再生的可耗竭性资源,被称为“现代工业的血液”。每当国际石油价格发生剧烈波动时,世界经济也会受到一定的影响和冲击。显然,石油价格的波动已经成为全球关注的焦点。地缘政治风险定义为影响国际关系正常发展、恐怖主义行为以及国家间紧张局势相关的风险指标。近年来地缘政治事件多有发生,如2018年中美贸易摩擦、2020年中印边境摩擦。一方面石油价格在一定程度上会影响国家地缘政治风险的变化,而另一方
学位
随着精神生活水平的日益提高和电子产品的不断更新,数字化电子化阅读逐渐成为人们阅读的习惯;电子书阅读器作为一种主打阅读功能的电子产品,受到广大阅读爱好者的欢迎。在电商网购平台迅猛发展和物流管理运输日益成熟的时代潮流中,在线网购成为购买电子书阅读器产品的重要渠道。消费者在电商平台中反馈的评价文本,对于挖掘消费者对产品不同特征属性的关注程度,分析消费者的体验感受具有重要意义。本文运用python爬虫技术
学位
2020年以来,监管部门多次发布政策文件,强调网贷平台以“良性清退转型”为主的工作,与此同时,商业银行从事互联网金融借贷的一些做法,在一定程度上也是延续了网贷平台的工作业态。因此在网贷平台清退和互联网信息蔓延迅速的背景下,基于文本信息对网贷平台兑付情况及其风险因素构建风险处置量化研究机制至关重要,这将有利于互联网金融的健康发展和监管机构的可持续发展。本文以网贷平台作为研究对象,结合当前网贷金融领域
学位
改革开放以来,中国积极推动工业化进程,经济快速增长,但同时带来了严重的环境问题。中国的碳排放量在改革开放后的四十几年里迅速攀升,目前我国的碳排放总量水平已经位于世界首位。面对严峻的环境问题,中国作为负责任的大国,在国际上做出碳减排承诺,并提出一系列可行性自主行动目标。面对巨大的碳减排压力,找到一个可以平衡环境与发展的有效措施变得尤为重要。回想工业化进程的几十年里,我国主要依靠大规模的能源消耗来支撑
学位
大数据背景下,用人单位对统计学类专业人才的需求量很大,这有利于统计学类专业的发展。但当前的统计学类人才需求和供给之间存在结构性矛盾:一方面,用人单位对人才的需求随时代不断变化,不同岗位的需求的差异性较大;另一方面,人才培养单位的培养方案同一化、专业课程设置不够先进,专业人才对市场需求也不够了解。这种矛盾不但给三方造成不利影响,而且会阻碍统计学类学科发展。本文旨在通过数据挖掘探究企业网络招聘文本中隐
学位
在全面建成小康社会决胜之际,我国经济已经转向高质量发展阶段。实体经济是中国国民经济的脊梁,制造业则是实体经济的基础支撑,因此制造业高质量发展是我国制造业实现从制造到创造、由速度到质量、由大国到强国的第一要义,是推动我国国民经济发展、提升综合国力的殷切需要。后疫情时代背景下,只有高质量的基础制造业才能对中国经济高质量发展提供坚实的战略支撑。目前的研究成果一般围绕高质量含义的解释,制造业高质量发展评价
学位
2020年初新冠疫情的爆发,对我国的国民经济造成了巨大冲击,我国金融市场遭受重大风险,我国股票市场发生震荡,疫情引发的风险冲击着我国股票市场并在股票市场中传染。探究疫情影响下我国股票市场风险的传染特征对于以后重大突发公共卫生事件下制定预防、降低以及控制股票市场风险传染的金融措施具有重要意义。目前关于此方面的研究较少,本文基于复杂网络视角,探究新冠疫情背景下我国股票市场风险传染特征,进一步研究疫情冲
学位
建筑电气设计工作质量的高低直接制约着人们对建筑体应用的舒适程度,而消防配电设计对人民生命财产安全具有重要联系。所以,在建筑电气设计期间,消防配电设计尤为重要。由此,该文就建筑消防配电设计展开全面分析。
期刊
数字货币即货币的数字化,其一般情况下由开发者发行和管理,它可以替代电子货币的形式。去中心化、数量稀缺等是以比特币为代表的数字货币的特点,其深受投资者的喜爱,全球各国对数字货币的关注程度也随着其市场规模的扩大和种类的增加而增大。但是,隐藏在数字货币背后的风险也是不可忽视的。一是价格剧烈波动诱引大量投机也引发了泡沫经济,价格剧烈波动,投资者追逐高利益的同时忽视了其潜在风险,酝酿了巨大的泡沫;二是劣币驱
学位