论文部分内容阅读
心血管疾病已成为全球人类的头号死因,严重危害人类健康,具有发病率高、死亡率高、病程不可逆等特点,早期检测和预防尤为关键。心血管疾病早期风险征兆往往反映在生理信号变化上,心血管生理信号分析,特别是针对人体系统本身非线性动力学属性而发展起来的非线性动力学分析,是早期发现疾病风险的重要手段。在已发展的非线性动力学方法中,熵测度是一类重要方法,因其特别适用于短时(约几分钟)信号分析而具有较高的临床应用价值。本论文主要围绕新近发展的基于模糊思想的熵方法进行研究,通过深入分析典型熵算法的原理和之间的关联性,阐述了熵算法由传统熵测度发展到模糊熵测度的原因和必然性;分析验证了心衰检测中典型参数的选取对传统熵算法和模糊熵算法的影响,确定了合理的参数选值规则;通过与机器学习结合,发展了针对特定心血管疾病异常(心衰、房颤等)的模糊熵测度分析方法,提升了熵指标的临床性能;在单变量模糊测度熵分析基础上,针对多时间序列间的耦合性和关联度,发展了多变量模糊测度熵方法,并验证了其对人体不同生理状态的识别能力。总结起来,本论文所做工作主要包括以下几个方面:(1)对近年来应用于生理信号分析的几类典型熵算法进行了综述,包括单变量熵、互熵、多变量熵、多尺度熵等,系统总结了每一种熵算法的发展过程、实现机制和优缺点,在此基础上提出了针对短时心血管信号分析,提升熵算法性能和临床应用效果的三个有益研究方向:熵参数取值的设计规则、熵计算过程中距离分布矩阵的信息挖掘、针对特定疾病/异常的熵算法设计,本文也正是围绕这三个方向展开具体研究。(2)嵌入维度m,阈值参数r和序列长度N的设置对熵结果有很大影响,针对单变量样本熵和模糊测度熵,以MIT数据库正常组和充血性心衰组RR间期序列为研究对象,对比探究了三个参数的不同选值方案,明确了能够区分正常/心衰组序列的熵参数取值范围,证实了模糊测度熵对应的有效(可区分)参数组合数目更多、且更具规律性,并且模糊测度熵在不同参数组合下,能够保持正常组熵值始终小于心衰组,具有更好的相对一致性。同时,研究了异位搏动间期对熵结果的影响,进一步证实在熵算法分析前进行异位搏动间期处理的必要性。(3)相重构空间中向量相似度(依据向量距离)的确定是熵算法的核心环节,算法通过计算由m维到m+1维相空间向量平均相似度的信息变化量确定熵值,实质是把二维向量距离分布矩阵的信息融合汇总成单一的熵值输出,这个过程丢失了大量序列模式信息。本文提出了一种结合距离矩阵图像和卷积神经网络(CNN)的正常/心衰分类方法,建立了针对心衰的机器分类模型,取得了较好分类效果。数据依然使用MIT数据库正常和充血性心衰患者的RR间期序列,分别使用样本熵、局部模糊测度熵和全局模糊测度熵计算过程中生成的距离矩阵图像作为CNN模型输入,分别在Matlab环境下和Tensorflow平台下构建了简易CNN和AlexNet模型两种方案进行正常/心衰分类,结果证实了使用全局模糊测度熵距离矩阵作为CNN输入对心衰识别效果最佳。(4)提出了一种新的房颤实时检测算法,即归一化模糊房颤熵,从五个方面对传统方法进行了改进:1)使用距离归一化函数重新定义向量距离,避免了传统切比雪夫距离定义的局限;2)采用模糊函数取代传统Heaviside函数来判定向量相似性,降低算法对阈值参数的敏感性;3)计算m维到m+1维信息变化量时使用密度估计取代概率估计,提高算法对极短序列的鲁棒性;4)依据向量相似的最小平均匹配数对阈值参数r进行动态调整,取代传统固定阈值做法,提高算法泛化能力;5)房颤发生往往伴随快速心率,在算法中减去平均RR间期的自然对数值来减弱心率对熵值的影响。针对MIT房颤数据库和实际采集的临床穿戴式心电数据分析表明,应用新算法区分房颤和非房颤片段时,其在敏感度、特异性、准确度、阳性预测率、阴性预测率、总误差、ROC曲线面积等评价指标上均优于三种对比算法(样本熵、模糊测度熵和系数样本熵),证实了新算法在日常房颤监测上的潜在应用价值。(5)多变量分析能充分利用心血管系统不同组分间的耦合性/关联性信息,模糊函数的引入能提升熵算法针对短时序列的统计稳定性,本文结合多变量分析和模糊函数两个概念,提出了多变量模糊测度熵算法,融合了局部多变量模糊熵和全局多变量模糊熵两部分的优点。针对仿真的耦合高斯噪声序列分析发现,随耦合度增加,多变量模糊测度熵呈严格的单调变化趋势,而对比方法多变量样本熵存在局部起伏,证明了新算法一致性较好。针对实际采集的心电RR间期序列、第一心音和第二心音幅值序列联合分析表明,使用任一三个不同位置的心音信号,多变量模糊测度熵在两种生理状态下都得到显著差异性结果,而多变量样本熵不能得到类似结果,证明了新算法对人体不同生理状态具有更好的识别能力。