论文部分内容阅读
乳腺X光摄影技术是最常见的乳腺癌早期诊断方法,目前主要通过医生观察和分析医学图像诊断病情,但是医学图像中包含大量的数据信息,其中隐匿的有用信息很难通过肉眼发现。同时随着互联网技术的发展,在线诊断成为发展的必然,医生将面对海量数据,通过数据挖掘方法对医学图像中隐藏的肉眼很难发现的信息进行分析,进而帮助医生做出诊断成为近年来研究的热点。由此引入高效的数据挖掘方法对医学图像进行准确快速的诊断和识别,从而提高医学图像分类精度,尽量避免医生错误判断,提高医生的工作效率。支持向量机是建立在统计学习理论基础上的一种机器学习方法,在解决非线性和小样本等问题上有独特的优势。对支持向量机不同于传统的支持向量机,它通过求解两个规模更小的二次规划问题来获得一对非平行超平面,使每一类都接近于相对应的分类面,而远离另一分类面。它是一种快速分类方法,不仅具有传统支持向量机的优点,并且具有很强的数据处理能力和推广能力,被广泛应用于模式识别和数据分类等领域。本文针对医学图像多类分类中出现的模糊性问题,较深入的探讨和研究了两种基于对支持向量机的医学图像分类方法,并将其用于医学图像多类分类中,提高了医学图像的分类精度。论文主要工作如下:(1)提出了基于遗传算法的决策树对支持向量机多类分类算法,并将其应用于医学图像分类中。本文提出了基于遗传算法的决策树对支持向量机多类分类算法,该算法将决策树和对支持向量机相结合构造分类器解决多类分类问题,克服了传统对支持向量机多类分类算法中出现的模糊性问题。该算法用遗传算法对特征数据建立决策树,通过构建决策树可以分离样本的模糊区域,提高模糊区域样本的识别率。在决策树的每个节点上用对支持向量机训练分类器,然后用训练的分类器进行分类和预测。将新算法分别在多组UCI机器学习标准数据集和医学图像上做分类实验,实验结果表明与传统的对支持向量机多类分类算法相比,新算法具有较高的分类精度和较快的训练速度。(2)提出了基于核主成分分析的决策树对支持向量机多类分类算法,并将其应用于医学图像分类中。为了全面描述医学图像所包含的信息,通常需要提取大量的图像特征,这样就使输入空间的维数过高,随着样本维数的增加,可能会使计算复杂度呈指数倍增长,因此必须使用有效的方法降低输入空间维数。本文将核主成分分析应用于特征降维,提出基于核主成分分析的决策树对支持向量机多类分类算法,实现数据维数的约简,然后在降维后的特征数据集上用决策树对支持向量机算法训练分类器,改善分类器的性能。将新算法在医学图像上做分类实验,实验结果表明与决策树对支持向量机算法相比,新算法具有更好的分类结果。