【摘 要】
:
目的:急性肾损伤(Acute Kidney Injury,AKI)是临床中的常见并发症,在ICU中发病率较高、死亡率高,医疗花费成本高,对急性肾损伤进行早期预测预警有助于辅助医护人员及早识别患者的恶化风险,在早期对患者进行干预以预防进一步的损害。随着电子健康档案的发展以及数据挖掘、机器学习方法在医疗领域中的应用,我们得以用大数据的研究方法对医疗数据进行挖掘,探究疾病的演化规律,这为我们深入研究AK
论文部分内容阅读
目的:急性肾损伤(Acute Kidney Injury,AKI)是临床中的常见并发症,在ICU中发病率较高、死亡率高,医疗花费成本高,对急性肾损伤进行早期预测预警有助于辅助医护人员及早识别患者的恶化风险,在早期对患者进行干预以预防进一步的损害。随着电子健康档案的发展以及数据挖掘、机器学习方法在医疗领域中的应用,我们得以用大数据的研究方法对医疗数据进行挖掘,探究疾病的演化规律,这为我们深入研究AKI,发展AKI的预测预警模型提供了机会。然而对电子健康档案的二次分析面临的一大问题是数据的稀疏性与采样的不均衡性造成的数据缺失,应用电子健康档案(Electronic Health Records,EHR)时间序列首先需要对缺失值进行处理。本研究将探讨针对医疗时间序列如何选取插值方法,并基于集成学习与深度学习方法构建AKI预测预警模型,为医护人员提供更好的决策支持。方法:本研究首先ⅰ.)探讨了连续动态生理数据中缺失值的插值方法,评估高斯过程(Gaussian Process,GP)在处理生理信号缺失中的有效性。ⅱ.)基于机器学习方法LightGBM模型探索AKI预测模型,在公开的大型ICU数据库重症监护医学信息数据库(Medical Information Mart for Intensive Care,MIMIC-Ⅲ)中采用患者 24 小时内首次生理生化测量值预测患者的发病风险。ⅲ.)采用多变量注意力机制长短期记忆网络-全卷积神经网络模型(MALSTM-FCN)构建AKI时间序列预测模型,以患者入ICU后的时序数据预测当前时间往后第2h、6h、12h以及第24h发展为AKI的风险,并评估不同的缺失值的处理方法对模型性能的影响。结果:ⅰ.)高斯过程在处理生理信号缺失问题中表现优异,在连续缺失与非连续缺失两种缺失模式下,均方误差(Mean-Square Error,MSE)均为最低。ⅱ.)MIMIC数据库中满足条件的21722名患者中,有8694名患者发展为AKI,发病率为40.0%。以患者首次测量值构建AKI预测模型,LightGBM模型表现最佳(LightGBMAUC 0.93,ACC 0.87;随机森林 AUC 0.90,ACC 0.86;Logistic 回归 AUC 0.74,ACC 0.75)。ⅲ.)MALSTM-FCN时间序列预测模型及LightGBM模型结果显示,提前2h、6h预测的最佳AUC分别为0.908(LightGBM-线性插值模型)和0.902(MALSTM-GP插值模型、LightGBM-线性插值模型),第12、24小时最佳的AUC分别为0.890(MSLATM-GP插值模型),0.877(MSLATM-GP插值模型)。预测准确率最高的模型为MSLATM-GP插值模型,在2h、6h、12h及24h的预测准确率分别为0.819、0.818、0.806 和 0.798。结论:机器学习方法为我们发展疾病预测模型提供了有效的手段,在处理生理信号缺失问题中,高斯过程插值表现优异。采用高斯过程对EHR缺失数据进行插补并构建AKI时序预测模型,提前2h LightGBM-线性插值预测模型的AUC可达0.908,MALSTM-高斯过程插值模型在提前6h、12h、24h的模型中表现最佳,AUC可达0.902、0.890 和 0.877。
其他文献
研究目的:对浙江大学医学院附属第一医院2010.1~2011.12及2016.1~2017.12确诊前列腺癌患者的诊治模式进行研究,了解近六年我院前列腺癌初诊治疗模式的诊疗现状及演变趋势,明确
目的:比较OSSTEM骨水平(TS)种植系统实心基台与转移基台在磨牙区种植修复后的临床效果。方法:选择2015年6月至2015年10月间就诊于内蒙古医科大学第四附属医院口腔科,由于严重牙体疾病、根尖周炎、牙周病等引起磨牙区牙齿缺失,于我院口腔颌面外科进行OSSTEM系统骨水平(TS)种植、修复科进行修复的患者。受试者随机分为两组:A组由50名接受实心基台种植修复的患者组成。B组50例患者,选择转移
在今天的拉祜西地区,头人组织在乡村社会中发挥的治理功能仍具有不可忽视的存在价值与现实意义。通过寻求头人组织在新时代背景下的创造性转化,探索其在乡村治理能力现代化中发挥的作用,助力国家治理体系和治理能力现代化的建设的意义,发扬少数民族传统治理资源在乡村治理中的积极影响。少数民族地区社会治理中传统社会组织是多民族国家治理现代化的重要内容之一,也是乡村社会走向现代化的有力助手。本文以云南省澜沧拉祜族自治
目的:基于基因表达综合数据库和癌症基因组图谱数据集,以及10位病理标本的实验,发现ASPM在膀胱癌中显著过表达,进一步阐明证ASPM基因过表达与膀胱癌的侵袭性及预后不良的关系
随着大数据和深度学习的发展,产业界和学术界对建立对话系统的兴趣激增。对话系统有着巨大的商业价值和社会价值,但建立一个开放域的闲聊机器人具有挑战性,因为它要求对话系统能够回复人的各种主题类型的输入。对于闲聊机器人,其主要任务是回复选择,目前主流研究侧重于上下文对话和候选回复之间的匹配模式,对上下文对话的内部关联信息和对话之外的外部知识关注得不够。对于这些问题,本文在已有的研究基础上,对检索式多轮对话
在计算与存储的虚拟化成为当前数据中心的一大热点,云计算技术得到广泛应用的今天,越来越多的企业选择将基础服务转移到云上,不断增加的业务、激增的用户数、海量的数据存储以及相应的高性能需求,使得云平台的规模不断变大,极大的增加了部署工作的困难程度。然而,部署环节在云平台的使用周期中是不可或缺的部分,在没有企业级的替换方案前,传统基于网络架构的自下而上的部署模式和复杂的管理机制难以满足现在的部署需求。因此
21世纪是我国全面推进素质教育的时期,学校音乐教育作为素质教育的主阵地,在这场历史性的教育改革中扮演了一个不可替代的特殊角色。教师作为教育的生力军,成为大家所关注的
今天,行政机关负责人出庭应诉已不再是什么罕见的事情,与过往相比较,出庭应诉率明显提升,这对行政争议的解决,能够起到一定的积极作用,并在一定程度上会改善官民矛盾。不过,此项制度自推行起始终存在部分问题尚未解决,本文以行政机关负责人出庭应诉的概念作为切入点,分析与探讨行政机关负责人出庭应诉制度具有的意义。现阶段,对行政机关负责人出庭应诉问题,我国尚未建立起成熟的制度,存在立法不完善、运行状况不佳、监督
在物理世界中,多相流的分布非常广泛,但是因为温度、气压等环境的影响,其介电常数不会恒定不变。在被测场域中不会仅仅只存在一种介质,常常是多种介质混杂的情况,这就导致无法对介质数量和介电常数的实时检测。并且多相流还具有繁杂的流动特性,这就造成无法用一般的数学模型进行完整描述的问题,所以实际应用中的测量就会非常困难。现今,针对多相流的实时检测与图像重建的实验,大多处于仿真验证阶段,尽管有一些成果已经投入
云以及移动互联网在近几年内飞速发展,各类应用对存储的读写性能与容量表现出更高的需求。非易失内存具有堪比内存的延迟与带宽,满足很多低延迟应用的需求。而非关系型数据库之中的键值系统(Key-Value,K-V),凭借高性能,强扩展性,使用灵活等诸多优势,在业界受到研究者的青睐。日志结构合并树(Log-Structure merge tree,LSM-Tree)是KV存储系统普遍采用的索引结构,通过将随