基于电子病历数据挖掘的急性冠脉综合征风险评估方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:binghemiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
心血管疾病是全球死亡的主要原因之一,急性冠脉综合征(ACS,Acute Coronary Syndrome)为其中的一种,在其早期治疗中,评估患者会发生诸如心肌梗死、中风或者死亡等不良事件的风险程度是一个非常重要的阶段。对病人的个体风险评估,可以帮助医生选择最合适的治疗策略,降低ACS致死率。传统的诸多评分工具如GRACE,TIMI等,大多根据队列研究建立。其由于队列研究严格的入组条件,使得样本与实际临床环境存在偏差,同时由于使用较少的风险因子,限制了工具的性能,并难以纳入新的风险因子。近年来随着医院信息化的发展,更多的基于机器学习的模型被开发出来,这些模型使用电子病历数据,更好地反应了真实的临床环境,可以纳入更多的风险因子,使用先进的机器学习模型,可以取得更好的性能。然而,这些模型中仍然存在一些问题,如现存的模型通常忽略数据集样本之间、特征之间的关联信息,以及ACS本身存在三种不同诊断亚型(STEMI,NSTEMI,UA),现有的模型并未考虑亚型之间的区别与关联信息。为了可以更好的处理样本之间、特征之间的关联信息,本论文提出关系正则化的ACS患者风险评估方法,通过拉普拉斯算子将样本之间和特征之间的关联信息进行编码,并以正则项的形式引入到模型训练过程中。之后针对目前风险评估模型多为浅层模型的现状,本论文提出了正则化的深度学习ACS风险评估模型,将样本之间的关联信息以正则项形式引入堆叠式自动编码机中。最后对于ACS存在不同亚型的情形,本论文提出基于对抗网络的ACS患者主要不良事件预测方法,将多任务学习框架和对抗训练结合,通过深度学习模型提取亚型特征有的以及亚型之间所共有的特征,以更好地进行不良事件预测。本论文使用来自国内某三甲医院的电子病历数据对我们所提出的模型进行评估,实验结果表明:我们所提出的正则化可以有效地利用样本之间、特征之间的关联信息,提升模型风险评估的性能;多任务对抗模型可以利用亚型之间的特性与共性,在不良事件预测上取得不错的性能。本论文所提出的方法在风险预测上可以取得比最先进的机器学习模型更好或相当的预测性能,充分利用了电子病历数据的价值,为ACS或其他疾病的风险评估研究提供了新的思路和技术手段。
其他文献
随着社会的发展,道路交通环境越来越恶劣,道路交通数据呈现爆炸式增长的趋势。对此,本文基于边缘计算环境下基于窄带物联网技术(Narrow Band Internet of Things,NB-Io T)和
近年来,随着中国一带一路倡议的不断深化,中国与俄罗斯不断拓展合作的深度和广度,随之而来的是跨国犯罪的不断增多。为了联合应对不断变化发展的跨国犯罪新形势,迫切需要翻译承担起语言与文化桥梁的作用。在开展国际警务交流合作与处理跨国案件时,及时、准确、全面地翻译信息与情报,达到互通有无,尽快破案的目的。本文通过笔者参与的俄罗斯远东法律学院汉语学习班的陪同口译工作,选取了校园参观与课程观摩过程的口译实践加以
本文主要研究低秩表示模型及算法应用。近年来,低秩表示的理论及应用得到了许多学者的关注,并在图像处理、数据分析等多个领域获得了成效。如何将在高维数据中隐藏的低秩结构精确地恢复出来是利用低秩表示来解决各个领域中问题的关键,然而对于低秩表示模型的求解是一个NP难的问题,因为在低秩表示模型中通过实现对矩阵的低秩约束来达到矩阵恢复的目的,但是秩函数是离散函数。现行模型通常以核范数去近似秩函数,虽已可到达秩近
香蕉是世界四大水果之一,在世界水果中占有极其重要的位置。目前我国香蕉果园的管理缺少信息化的支撑手段。如何自动获取香蕉的重要生长参数,提高种植园的科学管理水平,是亟
磁谐振耦合无线电能传输技术是当前无线电能传输领域的热点课题。磁场作为能量传输的媒介,直接影响着系统的传输效率,空间磁场分布研究是解决该技术目前面临问题的一个重要途
信息物理系统(Cyber-physical systems,CPSs)的分布式融合估计因计算速度快、可靠性高、容错能力强等特点受到人们越来越多的重视,在工控系统、智能家居等领域得到广泛应用。
非线性和时滞是控制系统中普遍存在且不可避免的物理现象,也是控制理论研究的热点和难点之一。由于Takagi-Sugeno(T-S)模糊模型具有无限逼近封闭有界定义域内的任意连续函数
在下雨天气获取图像时往往会在图像中产生雨痕,导致图像中的物体信息被破坏。这可能会导致后续计算机视觉系统的性能下降或者让拍摄者获取不到理想中的照片。要从单一图片中
随着我国经济的发展,我国也渐渐把目标放在从“经济导向”到“社会导向”,“政府本位”向“民众本位”的方向转变。提出了建设服务型政府的目标。近几年从“让市场其决定性作
伴随着大数据时代的到来,人类社会进入了一个“数据化生存”的时代,人们每时每刻都在获取海量高维数据。然而,在计算机视觉、图像处理和信号处理等研究领域,这些高维数据往往是冗余的且含有噪声,给数据的存储、传输和分析带来了巨大的困难。因此,对这些海量高维数据进行降维和去噪处理是十分必要的。其中鲁棒主成分分析模型是目前已有的主流降维、去噪方法之一。本文主要研究鲁棒主成分分析模型、算法的改进及其在图像处理中的