论文部分内容阅读
近年来,深度学习技术的迅猛发展为医疗大数据的变革带来了机遇。由于医疗数据的复杂性,深度学习方法的在医疗领域的应用研究过程也充满了挑战。时间序列数据作为医疗数据的重要组成部分,按照数据特性可分为两类。对于非连续的多元临床时间序列通常具有稀疏性,由于仪器设备故障、人工记录不定期等因素,造成信息丢失甚至掩盖了有效的特征;而对于连续的波形时间序列,其在短时间内蕴含了大量的时频信息,但同时存在干扰信号,可能造成诊断失误。总之,现有对于医疗时间序列的研究,由于数据的复杂性,其潜在信息不能有效被挖掘。本文以探索多元临床时间序列的稀疏性质、波形生理信号数据的时频性质为出发点,探究深度学习模型在医疗时间序列上的最优应用方式。研究内容包括:1、提出了一种截断式最近邻缺失值插补方法结合缺失掩码信息输入的缺失值处理方式,以提高深度学习方法对稀疏多元的医疗时序数据的预测效果,表明缺失值处理方式对端对端的深度学习模型的效果影响不可忽略。本文提出的新型缺失值处理方式以MIMIC-Ⅲ临床数据集中提取的EHR数据样本为实验数据支持,在深度循环神经网络模型得到验证。在与逻辑回归机器学习基准模型的对比实验中,证明深度学习模型在稀疏多元的EHR数据的建模上,不仅可省略特征提取的复杂步骤,且在最终的模型效果上也存在一定的优势;在与其他缺失值处理方式的对比实验中,证明本文提出的新型缺失值处理方式具有显著的优势,对于临床上预警危重患者具有重要的意义。2、提出了一种结合经验模态分解与深度学习方法的新框架,可端对端地分析与处理波形生理信号,以辅助医疗诊断。该算法的创新点在于,以经验模态分解(EMD)的高频分量信号作为心电信号补充信息输入到神经网络模型中,由于EMD具有自动提取噪声与基线漂移的作用,整个过程不需要手动提取特征,可充分挖掘波形生理信号的时频信息。另外,该模型设计的新亮点在于可以解决不定长的ECG信号的分类,而不需要进行波形检测、定位以及信号分割。以MIT-BIT心律失常数据集为实验数据支撑,实验表明EMD辅助层对于简单网络的分类效果具有明显的增益,证明了 EMD辅助层的有效性,而含EMD辅助层的复杂网络在较难分类的小样本心跳类别的分类效果可得到一定的提升。另外,与现有的心跳分类深度学习技术的结果对比,显示在综合评价指标上本章提出的模型框架优于绝大多数的现有研究技术。