论文部分内容阅读
乳腺癌是女性中最常见的癌症,临床医学中,病理图像分析是癌症诊断的金标准,但病理图像信息量大,病理医生依据病理图像给出诊断结果,耗时耗力且效率低下,甚至容易造成误诊。现阶段,深度学习在图像识别领域崭露头角,这为处理病理图像提供新思路。本文利用深度学习对病理图像进行乳腺癌肿瘤类型分类和癌症区域分割,通过计算机辅助诊断减轻病理医生繁重的工作,同时降低误诊的概率。论文主要工作如下:1.设计了改进的VGG16网络对乳腺癌病理图像进行分类研究。针对卷积神经网络训练需要大量样本而数据集BreakHis病理图像样本不足问题,利用常见的图像变换方式和基于直方图均衡化改进的图像增强方式对病理图像进行处理,从而使数据集得以扩充。利用基于迁移学习的VGG16网络对乳腺癌病理图像进行分类实验,避免了重新设计和训练网络模型。实验表明,VGG16网络的全连接层越深,分类准确率越高。由于难以通过增加全连接层层数来提高VGG16网络的分类性能,提出了组合两个全连接层提取到特征的方案以改进VGG16网络,并通过大量实验探究两个全连接层最佳组合方式,最终实验表明,改进的VGG16网络提高了分类准确率。2.设计了聚类的残差网络提高分类准确率。本文在残差网络前加入聚类算法,设计了基于聚类的残差网络模型,该模型利用残差网络作为基础网络进行训练以解决深层网络退化问题,并利用聚类算法对乳腺癌病理图像进行像素聚类,使得特征分区,有助于残差网络进行特征提取,此外还在网络中加入批标准化操作以加快训练速度。最终实验表明了基于聚类的残差网络能在一定程度上提高分类准确率;相比于改进的VGG16网络,基于聚类的残差网络能够提高某些倍数下乳腺癌病理图像的分类准确率。3.基于分类网络设计了分割网络对病理图像进行分割研究。考虑到全数字病理图像包含大量的无关背景信息,首先采用Otsu算法分割出感兴趣区域。由于二维Otsu算法计算复杂,给出了Otsu算法快速计算方式;根据病理图像感兴趣区域和背景区域着色特点,在Otsu算法中引入颜色元素,提出了分割全数字病理图像感兴趣区域的Otsu算法。最后基于分类网络设计了分割网络,针对网络难以训练整张全数字病理图像的问题,利用剪裁全数字病理图像而获得的样本进行训练,最终通过拼接图像块分割结果获得全数字病理图像的分割结果,准确定位全数字病理图像中的癌症区域。