论文部分内容阅读
乳腺癌是一种常发于女性的癌症类型,其正成为世界上导致妇女死亡的主要病因。目前人们尚不完全了解乳腺癌的病因,因此早发现、早治疗对于提高此病的存活率具有深远意义。恶性乳腺结节也就是人们常说的乳腺癌,但无论是良性的结节还是恶性的乳腺结节,都会使患者的身心健康受到威胁。准确地鉴别乳腺结节的性质对下一步的治疗至关重要。因此,如何利用计算机辅助诊断技术来尽可能地帮助医生诊断此病是本文的研究目的。20世纪90年代,核函数方法(简称核方法)在模式识别与机器学习领域引起了广泛地关注。随着核函数的理论发展不断趋于成熟,许多表现优异的算法都与核函数的加入有关。因此,本文主要采用基于核方法的相关算法来辅助诊断乳腺结节的良恶性。乳腺结节超声图像属于高维数据,如果不对其做任何处理,而直接训练分类器,将会导致维度灾难与效率低下等问题。因此为了提高分类精度与分类效率,将原本高维的超声图像进行维度归约是非常有必要的。本文的主要工作如下:1)本文研究了主成分分析、线性判别分析、核主成分分析和高斯过程隐变量模型这几种经典的降维方法。本文使用主成分分析、核主成分分析和高斯过程隐变量模型对乳腺结节图像进行降维实验。经过详细地理论分析与实验对比,本文最终选取了高斯过程隐变量模型的降维结果作为分类器的输入数据。2)本文将经过高斯过程隐变量模型降维后的图像数据进行五次随机的有放回采样,最终将得到五组不同的训练集和测试集进行模型平均。本文提出了三种不同的分类方法来构建分类模型,即K-近邻、决策树和支持向量机方法,并研究这三种方法的适用性与优缺点。经过多次实验,来对比这三种分类器的平均分类准确率。最终可得出选用高斯径向基核函数的支持向量机,其分类性能要普遍优于其他分类器。3)最后为了验证降维的必要性,本文对未经过降维后的数据直接进行分类。同时,为了更深入的研究核函数的选取对算法的影响,本文又为高斯过程隐变量模型和支持向量机选取了不同的核函数来对乳腺结节图像进行处理。