集成学习和模型解释方法在脓毒症诊断中的应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wenrou1323
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脓毒症由于发病机制复杂,常伴随多种并发症且病程发展迅速,给临床诊断和预后带来了极大的困难,已经成为世界第三大死因。寻找生物标志物以便提前识别脓毒症和及时治疗,是降低死亡率的关键。现有利用机器学习从大数据中找标志物的方法往往面临数据缺失,以及模型可解释性不足等问题。纳入全面的潜在危险因素,利用可解释性机器学习方法发现脓毒症早期生物标志物,具有重要的理论与临床意义。在收集整理武汉同济医院相关临床数据的基础上,利用集成学习和模型解释方法对脓毒症进行风险预测和危险因素分析。首先,在分析了医疗数据的高维稀疏性、异构和不规则采样等特点后,对可采用的特征筛选、集成学习以及模型解释方法等进行了分析。其次,针对电子健康记录特点,设计并实现一套针对多源异构医疗事件的数据抽取框架,将杂乱无章的原始医疗记录转化为结构化的病人表征向量;提取并且清洗建立了脓毒症研究数据集,包括普通脓毒症和新型冠状病毒肺炎(COVID-19)脓毒症数据集。最后,针对数据集高维稀疏特征空间、特征高度相关以及冗余特点,设计了一种结合特征筛选和梯度提升树的可解释性脓毒症风险预测模型。基于梯度提升树变量重要性对特征进行排序,通过迭代剔除冗余特征,在最优子集上训练模型。然后利用事后模型解释方法对最优预测模型进行解释验证。提取到2012年至2019年在同济医学院检验科做过血培养的44926名病人,以及2020.2-3月确诊为COVID-19的4207名患者。从中匹配到普通脓毒症数据集16051例,脓毒症阳性6329例和阴性9722例;COVID-19脓毒症数据集2453例,新冠脓毒症1376例,新冠非脓毒症1077例。预测模型在普通脓毒症数据集上取得91.17%的受试者操作曲线下面积(area under the receiver operating characteristic curve,AUC)和83.07%的准确率;在新冠脓毒症数据集上取得93.49%的AUC和91.03%的准确率。解释方法找出了儿童高风险的证据,并分析了凝血功能和炎性因子对新冠脓毒症的影响。利用炎性因子等45个指标能够提前平均3.68天预测新冠患者凝血异常,准确率和AUC分别达到88.57%和94.31%。
其他文献
减隔震技术在国内研究多年,已经在工程中普遍推广应用,滑移隔震体系在减隔震上有独特优势,但是控制位移上有缺陷,普遍研究比较多的叠层橡胶垫隔震体系耗能能力较弱,承载能力不强。本文针对目前隔震装置的一些缺点或不足之处,设计研究一种新型分离式隔震装置,这种新型隔震装置具有摩擦滑移支座的耗能能力,叠层橡胶垫支座稳定性、控制位移和回复能力,在构造设计上基于可装配式的理念,在实际中有更大的适用性。本文首先用理论
近年来,随着污水排放标准不断提高,大部分城市污水处理厂尾水满足国家一级A排放标准,但其水质仍与类四类水差距较大。污水处理厂尾水直接排放将对受纳水体造成污染,尾水的深度处理尤其是脱氮处理具有十分重要的环保意义。生物接触氧化工艺具有污染物去除效果好、能耗低、占地面积小且运行维护简便等优点,在污水处理厂尾水净化工程中应用较少。本文分别采用复合脱氮菌(BP)、贫营养脱氮菌(ODN)和取自活性污泥培养菌(A
近年来,我国汽车保有量不断增加,引发的能源危机和环境污染问题越来越严重,而发动机燃油的雾化质量直接影响着汽车的动力性、经济性和有害物排放。对燃料喷雾特性的研究一般采用试验和计算两种手段,现有喷雾试验常在光学发动机中进行,喷雾图像处理及喷雾特性参数的测量就显得尤为重要。鉴于此,本文基于课题组的光学发动机进行燃料喷雾测试,并运用数字图像处理技术,实现对喷雾图像的处理与宏观特性参数测量。首先,利用高速摄
表面质量检测是保证产品质量和美观度的关键环节,同时也是生产线真正实现自动化所必须突破的瓶颈。近年来关于漫反射表面缺陷自动化检测方法的研究引起了包括汽车生产公司等在内的越来越多的企业的重视。目前,制造企业在检测过程中普遍还是采取人工检测的方式,即通过人眼在不同光照强度与不同角度的光源下对产品的涂装表面进行检测。这种方法存在工人劳动强度大,工作环境差,检测效率低和检测成本高的问题。本研究试图通过优化检
目的:已有前瞻性研究显示,体内硒或铬水平升高与甘油三酯水平降低存在显著的关联性,但此前的研究多为单一金属的研究。我们进行了多种金属复合暴露与血脂异常关联性的前瞻性研究,为我国中老年人群血脂异常的防治工作提供科学依据。方法:基于本队列已经开展的三个巢式病例对照(新发冠心病、糖尿病、脑卒中)研究人群,排除基线患有癌症、心血管疾病、血脂异常及有缺失信息的人群后,共纳入2947名研究对象。血脂异常确诊标准
纵观我国地震史,地震的发生具有不确定性,多次破坏性大震发生在低烈度区,且同时由于设计标准偏低,结构破坏严重。桥梁结构作为交通运输的主要承担者之一,目前相关学者们在其减隔震上做了很多有意义的研究,发明制作了非常多的隔震消能装置,但这些装置或多或少存在不足。基于此,本文针对环形钢丝绳-钢球型组合隔震支座水平剪切性能及其减震效果进行研究,主要研究内容如下:1、根据试制14个环形钢丝绳减振器水平剪切性能的
随着我国老龄化程度的提高,小微建筑工程中高龄工人的比例在不断增加。在建筑行业中,跌倒是一类主要的致死性伤害类型,跌倒在高龄工人中发生的比例要高于年轻人,跌倒事件的发生往往会带来直接的肢体伤害及其二次衍生伤害,给高龄工人自身及家庭、社会都带来了极大的医疗经济负担,预测跌倒风险有助于减少跌倒事件的发生。本文的研究对象包括高龄人员54名,其中包含名31名女性和23名男性。通过多重分形算法对高龄工人头颈部
随着产业互联网的高速发展,软件和互联网行业在近几年迎来了新的增长点。行业的发展加速了软件领域知识和技能的迭代,软件开发人员需要掌握大量的编程技能,当遇到编程相关的问题时,他们通常会通过搜索引擎在编程问答网站(例如Stack Overflow)上查找问题的答案。与通用领域的检索不同,软件领域的检索是高度专业化的,查询和文档内容中包含着专业术语和符号,这使得开发人员很难高效地定位他们想要的信息。为此,
综合管廊是一种可以容纳供水、通信、电力、燃气等多种市政管线的地下空间结构。由于综合管廊的高度标准化,预制拼装技术已成为综合管廊建设的新趋势和研究热点。对于采用分块预制拼装技术的综合管廊,接头是其薄弱部位,对变形非常敏感,也容易出现渗水漏水的情况,而国内外在分块式预制综合管廊接头力学与防水性能方面的研究较少。因此,本文基于武汉市武九线综合管廊工程项目,开展了分块式预制综合管廊接头抗弯刚度与防水密封垫
目前,我国大气污染有所改善,空气质量问题在一定程度上有所缓解,但是仍需要进一步解决,武汉城市圈也不例外。根据武汉城市圈独特的地理位置,大气复合污染以及空气本身的流动性、复杂性等因素,情景模拟是武汉城市圈空气质量改善的有效手段。同时,WebGIS(网络地理信息系统)具有强有力的空间表现力,常用于大气污染系统的开发中。因此,基于WebGIS开展污染物总量控制约束下情景模拟减排措施研究,为大气环境制约下