论文部分内容阅读
动态心电图自投入使用以来,就以其简单、方便、无创的特点在临床中得到广泛的应用。其主要价值是用于发现并记录在通常短暂心电图检查中不易发现的,及日常生活时发生的心电图改变,为临床诊断和治疗提供依据。但由于动态心电图记录了近10万次心跳的波形,因此在较短时间内检查到个体变异波形比较困难,如何快速准确的检测到个体变异波形成为研究的重点。本文将数据挖掘中的聚类算法应用到动态心电图中,利用聚类将占大部分的先天波形筛选掉,减少用于诊断的动态心电图波形的数量,使得病变波形更加明显,从而提高诊断的效率。本文在详细分析动态心电图的波形特点及检测特点的基础上,提出将机器学习技术中的聚类策略应用于动态心电图的前期分析,为后期的波形筛选分析作准备。但由于动态心电图信号弱,噪声强且随机性强,因此必须对其进行预处理。经研究发现,小波变换具有的良好时频局域化特性,对于时变信号分析有独特的特点,但其计算复杂度较高,因此不能用于实时分析处理。而另一种阈值检测方法实时性高,但精确度低,针对二者的优缺点,本文将二者融合用于动态心电图的R波定位,获得了较好的结果。聚类策略可大体分为两类:无预先给定聚类类别数k的聚类方法和需预先给定k的聚类方法。k值的给定对聚类结果影响很大,然而在对数据的实际情况毫不知情的情况下是无法准确确定k值的。而无预先给定k值的聚类算法或者聚类准确度不高,或者产生较多的聚类类别数,与实际聚类类别数不符。针对以上两种聚类策略的优缺点以及各个聚类方法的特点,结合动态心电图波形自身的特点,本文提出用无预先给定k值的方法确定类别数,然后利用需预先给定k值的聚类方法进行计算,得到SOM_AGG_k-means和Max-min Distance_k-means两种聚类策略。SOM_AGG_k-means聚类策略将自组织特征映射(SOM)神经网络,凝聚聚类和k-means算法结合,首先用SOM算法对初始的动态心电图进行粗略聚类,获得m个类别,然后用凝聚聚类算法对该m条数据进行聚类,获得初始的聚类中心和初始聚类类别数,最后用k-means算法对初始的动态心电图进行聚类。Max-min Distance_k-means聚类策略将最大最小距离和k-means算法融合,首先,从初始动态心电图数据中随机选取一定比例的样品,其次,用最大最小距离算法对选取的样品进行聚类,获得初始的聚类中心和初始聚类类别数,然后用k-means算法对初始的动态心电图进行聚类。实验表明,这两种聚类策略得出的结果都具有较高的聚类准确率,且获得的类别数与实际类别数相差不大。