面向缺失数据的时间序列分类方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:cqxiaoguai1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了了解病人的身体状况,医生会对病人的各项生理指标进行监测,这些监测记录形成了医疗时间序列。我们可以根据这些记录对病人的住院死亡与否、所患疾病以及住院时间长短等进行预测任务。医疗时间序列的缺失率比一般时间序列高很多,原因是医生只会选择与病人身体状况相关的变量进行监测,而且不同的变量有不同的监测频率。在医疗时间序列分类问题的研究方面,相关学术论文总量不多,但近年来依然有两个出色且具有影响力的模型。它们分别是GRU-D和channel-wise LSTM。因为它们优越的性能和简洁的设计原理所以它们已经在很多问题上得到应用。但是他们的缺点也不可忽视。GRU-D没有考虑变量的缺失率,而且它在训练过程中把真实值和填充值混合相加,让模型不能直接感应真实值的变化以及不能同时接收每个变量和它的缺失标记。channel-wise LSTM针对每个变量都采用了一个独立的LSTM模型进行处理,模型的计算量巨大。在GRU-D和channel-wise LSTM的启发下,本文提出了一个能独立感受变量的GRU(variable sensitive GRU,VS-GRU)。它有三个创新点:第一,因为变量的缺失率与它对患者的重要性息息相关,VS-GRU不仅考虑了变量的缺失标记还分别考虑了每个变量的缺失率,使模型能够在总体上对变量的缺失情况有所掌握。第二,VS-GRU使用了一个简单的架构让GRU能够同时独立地对变量进行信息挖掘,因此高缺失率的变量不会对低缺失率的变量的信息提取过程造成干扰。不仅如此,模型能够对真实观测值的变化更加敏感,可以同时感受一个变量和它的缺失标记。为了解决更为复杂的多标签分类问题,本文在VS-GRU的基础上提出了它的信息融合增强版本VS-GRU-i,它由两层GRU组成,第一层是VS-GRU负责为每个变量单独提取信息,第二层GRU负责把第一层提取的信息进行融合。第三,VS-GRU和VS-GRU-i都采取了深度监督的框架,对每个时间步的输出都进行监督让训练过程中出现错误的概率降低。本文采用了两个真实的医疗数据集MIMIC-III和Physio Net进行实验,在它们的四个分类任务中VS-GRU在单标签分类中取得最优表现,而VS-GRU-i则在多标签分类中取得最优。
其他文献
灌区是我国商品粮、棉、油的重要基地,在保障国家的粮食安全、保护生态环境、发展区域经济、建设现代化农业等方面发挥了至关重要的作用。21世纪水资源短缺将成为制约我国农
本文主要针对具有传感器故障和外部网络攻击的离散非线性神经网络系统设计了非脆弱状态估计器,保证了状态估计的准确性和有效性。主要工作如下:(1)目前,欺骗攻击作为最常见的网络攻击方式,其主要修改系统中数据的完整性与真实性,使系统接收到一个虚假的数据以至于执行器做出错误的行为,使系统受损。在这种情况下,对状态估计器的准确性就有了更高的要求。在实际的复杂环境中,状态估计器会由于各种外界因素的影响,不可能一
闽江河口国家湿地公园被称为福州市―后花园‖,是福州市生态系统中重要的子系统,目前成为福州市民观赏鸟类、亲近自然和缓解压力的重要场所,深受福州市民的喜爱。传统旅游业的发展给目的地的生态环境带来了巨大挑战,随着经济水平的提高,游客开始追求物质需求之上的精神需求,找到能够平衡保护自然生态环境和满足游客自身需求的旅游活动,绿色旅游应运而生。绿色旅游不仅是社会发展的标志和特征,也是现代文化进程中必不可少的一
锂硫电池因具有较高的理论能量密度和较低的成本,被认为是最有前途的可充电电池体系之一。然而,锂硫电池的实际应用受到多硫化物溶解和硫绝缘等问题的严重限制。因此,本课题
本文主要从语义和修辞两个角度入手,探讨“尘”及其参构语词,兼析《全唐诗》中的“尘/尘”。论文主要分为五个部分:绪论概述“尘”及其参构语词现有研究成果,发现已有成果较少系统梳理“尘”及其参构语词的语义;也较少从修辞角度探讨特定语用环境中的“尘/尘”的语义,据此选定本文研究切入点。第一章依据辞书释义尝试梳理、归纳出“尘”的8个义项:尘_1(尘土,灰尘),尘_2(蒙尘,污染),尘_3(人间,俗事),尘_
本文主要研究图的符号星独立数与符号星k-独立数,重点讨论两个问题:图的符号星独立数与k-独立数的上、下界,特殊图的符号星独立数与符号星k-独立数。图的控制理论是图论的一个重要的研究分支。近年来,图的控制理论由传统的点控制数的研究逐渐向边控制数发展,各种边控制数的提出和研究,极大地丰富和发展图的控制理论。其中,图的符号星控制数是一个重要的边控制数。本文类比图的符号星控制数的概念,引入图的符号星独立数
马铃薯黄萎病严重限制着马铃薯产业发展,其病原菌能以休眠体的形式在土壤中长时间存活,引起系统性侵染,该病害在马铃薯整个生育期均可发生,对马铃薯的产量有着比较的严重影响
基于SOA架构的服务系统能够将服务集成起来满足用户需要。但服务系统是松散耦合的软件应用,它运行在动态变化的网络环境中,其可靠性会因为位置、通信链路等外部原因以及服务自身内部原因发生波动。预测服务系统的可靠性能提前了解系统可靠性状态,从而预防突发情况发生,确保服务系统稳定运行。因此,在服务计算领域,服务系统的可靠性预测已成为研究热点。目前服务系统可靠性预测方法大都研究如何提高预测的准确性,但忽略了可
灌溉排水泵站是以水泵为核心的机电设备和配套建筑物所构成的一个抽水系统,它集灌溉与排水功能为一体,是民生水利工程尤其是各大灌区的重要组成部分。特别是陕西地处西北干旱
本文将网络控制系统中的节点驱动方式设计为事件触发机制,从而达到节省网络资源的目的。由于现代科技的迅速发展,网络控制系统在许多领域的使用越来越普遍。在网络控制系统中往往采用传统的周期采样信号方式,这种采样方式在系统处于稳定运行时会继续周期性地执行任务,这样必然会造成资源的浪费也会增加网络运输负载,而且当网络带宽有限时还会影响系统的稳定性和其他运行性能。因此,为了解决这一问题,人们引入了事件触发机制,