论文部分内容阅读
结直肠癌(Colorectal Cancer)是胃肠道中常见的恶性肿瘤。2020年结直肠癌新发病数1931590例,占据全球第三,死亡数935173例,占据全球第二,结直肠癌的预防和治疗一直是医学界的一个难点。但对于结直肠癌来说,可以通过早期的癌症筛查来确定患者的身体状况,并通过手术治疗来提高患者的生存时间。目前,基于CT成像技术的癌症筛查技术得到的广泛的应用。区别于肠镜筛查手段,运用CT成像技术进行筛查具有无创性,操作简单,检出率高等特点。本文提出一种基于深度学习的结直肠癌CT图像分割模型,可以实现自动对结直肠癌CT图像进行病灶分割,在提高医生工作效率的同时降低结直肠癌的漏检率。本文通过对国内外深度在医学CT图像上的应用进行调研和对现有的分割模型进行分析,选择UNet图像分割模型作为本研究的基础模型。应用迁移学习的方法以及对UNet模型的改进,最终得到本文提出的分割模型。将本文提出的分割模型用于结直肠癌CT图像的癌症区域分割,能够帮助临床医生快速进行诊断。本文主要研究的内容包括结直肠癌CT图像数据集的采集,数据集的预处理,基础分割模型的选择,预训练模型的选择和分割模型的改进。本文具体的工作内容如下:(1)数据集采集。采集上海第六人民医院东院2018年至2021年所有结直肠癌患者的CT图像,并通过使用Micro Dicom软件对CT图像格式转换,然后使用Labelme工具箱对CT图像进行标注,最后获得完整数据集。(2)数据集预处理。由于CT扫描设备存在差异性,且采集到的CT图像数量较少。在模型训练时,容易发生过拟合的情况。为了尽量避免过拟合的产生,本文对结直肠癌CT图像进行了一系列的预处理操作,其中主要包括数据增广和数据增强。在数据增广方面,使用旋转、镜像操作对数据集进行增广。在数据增强方面,使用伽马变换来增强CT图像的对比度。同时为使得卷积神经网络能够学习到更多有效的信息,对CT图像进行区域裁剪,去除冗余部分,加快模型训练速度和提高精度。(3)基础分割模型的确定。本文通过分析FCN、Deep Lab、Mask-RCNN、PSPNet、UNet分割模型的优缺点,以及分析各个模型使用结直肠癌CT图像数据的模型训练效果。选择UNet分割模型作为本文的基础分割模型。(4)预训练模型的确定。由于结直肠癌CT图像数据集较小,为避免过拟合现象以及重头开始训练模型,使用预训练模型来进行训练。通过对医学领域常用的预训练模型进行分析。选择在大规模数据集Image Net上训练良好的VGG-19模型作为UNet网络中的预训练模型。(5)分割模型的改进。由于结直肠癌CT图像数据集规模小、UNet模型的结构简单,本文对以VGG-19为预训练模型的UNet模型提出了以下三点改进:增加SE模块、引入Drop-out正则化、用CARAFE上采样模块代替双线性插值上采样。本文通过改进前后模型的对比实验、学习率的对比实验、伽马值的对比实验、预训练模型的对比实验、分割模型的对比实验以及消融实验来验证本文模型研究的合理性以及模型改进方案的优越性。运用精确度(Precision)、召回率(Recall)、F1-score、Miou、Dice系数来对模型性能进行评估。通过实验结果可知,在各个模型评估指标上,本文提出的模型比改进前的模型分别高出15%(Precision)、7.3%(Recall)、12.1%(F1-score)、19.7%(Miou)、23.1%(Dice)。同时实验结果证明本文提出的改进方案比其他改进方案具有明显的优越性,能够更好的对结直肠癌CT图像病灶区域进行分割。