论文部分内容阅读
随着生物医学工程的迅速发展,越来越多的生物医学信息被数字化,心电图、动态心电图就是其中的典型实例,其研究内容主要集中于心电波形的波峰检测和识别。对动态心电图则还要对其所包含波形的种类进行分析研究,希望找到波形的所有形态用于心脏病诊断。每个个体的动态心电图一般有近10万个波形的庞大数据量,而且波形形态因人而异,很难找到同一的标准分类方法。因此,需要一种面向个体的动态心电图波形自动筛选系统,它可以从近10万个波形中筛选出所有波形形态的代表波形,达到实际的医学诊断要求。
机器学习作为一种智能信息处理技术,在诸多领域有着广泛的应用。动态心电波形中所包含大量数据对它来说是很好的分析数据源,而且机器学习可以面向个体样本,这与心电图波形的个体特异性相符。由此,本文提出了基于机器学习理论的动态心电图波形自动筛选的基本框架,对其中的关键问题进行了深入研究了,并取得了一定的成果。
(1)由于动态心电图波形具有明显的个体特异性,每个人的心电图,甚至同一人的不同时期的心电图波形都不尽相同;而且,动态心电图中包含的波形数量达10万左右,进一步每个波形转在转换为向量后,维度达200维左右;再有,波形筛选时间不能过久,一般在采集结束后1小时内得出结果。因此,本文提出了自动筛选的策略。首先通过少量样本的聚类分析,标定心电波形样本;然后利用样本波形迅速建立分类模型,然后在线粗略筛选(第一阶段筛选)后继波形性。这样心电信号采集和筛选可以同时进行;最后采用结合的聚类和相似性搜索方法完成细致筛选(第二阶段筛选)。
(2)对心电波形进行聚类分析,首先要解决聚类类别数的确定问题,类别数应与实际的类别数目近似。本文通过大量实验和医学专家指导,提出SOM神经网络、凝聚聚类混合模型解决聚类类别数的方法,并根据类别内部向量的紧凑度保证聚类效果。并在向量问相似性度量研究基础上,确定合适的聚类算法为基于City Block距离划分的方法k-means聚类算法在已获得的聚类数下进行聚类,获得较好的心电波形样本。
(3)为达到快速筛选动态心电图波形的目的,本文利用获得的心电样本波形训练分类模型,并以类别紧凑度作为衡量分类效果的标准。通过对分类模型的深入研究,找到符合心电波形自身特点的分类思路,从而进一步提出利用非线性的基于实例的分类系统筛选心电波形的方法,较好地解决分类准确度问题。同时,利用已建立的分类模型筛选心电波形可以满足筛选速度的要求。
(4)粗略筛选后遗留下来心电波形的再筛选问题的重点是如何确保不遗漏波形种类,有些波形的数量可能很少。为此,我们以类别内紧凑度度量为标准,提出SOM神经网络和相似性搜索结合的方法,利用类别细分与合并策略对心电波形进行细致筛选。
利用机器学习技术对动态心电图波形进行自动筛选本身是一种尝试,从具体实验效果来看,可以在一定程度上满足筛选的要求,这为类似心电波形的时序波形的处理提供了新的思路,并将智能信息处理引入实际的应用环境。