论文部分内容阅读
癌症作为一种致命性极高的疾病,其早期症状不明显,诊断难度较大,且病患数量增加的速度远超专业学者的培养速度。因此,利用计算机进行医学图像辅助诊断,实现癌症病理图像自动识别,成为当前行业的期许。本文对医学图像领域中的病理图像做基于深度学习的分类识别研究,主要工作包括:1)基于卷积神经网络的前列腺癌病理图像识别研究。设计基于深度学习的训练方案,用于从组织学图像中检测癌症转移。包括五个阶段:检测感兴趣区域(ROI,Region of Interest);通过ROI信息进行块采样、标注,作为训练数据;将标注后的采样块输入所选训练网络模型,训练基于块分类的神经网络;根据整张病理图像中采样块的二分类结果建立整张病理图像肿瘤概率热图;通过选取5个特征对热图做后处理,对组织切片进行诊断。使用VGG、Inception-v3、Res Net三种模型训练神经网络。最优模型Inception-v3在该方法下取得了ROC(接收机工作特性)曲线下面积0.860的成绩,性能达到较高水准。2)基于迁移学习的前列腺癌病理图像识别研究。为解决第一部分研究中前列腺癌病理图像紧缺的问题,提出利用已有的视网膜眼角图像和乳腺癌病理图像两个数据集对本文120例前列腺癌病理图像做迁移学习,训练基于块的前列腺癌图像分类模型。首先用VGG、Res Net-50和Inception-v3网络模型对两个预训练数据集分别预训练,模型收敛后保存模型权值,然后把前列腺癌病理图像采样块输入网络模型,对模型进行参数微调。实验结果表明,针对前列腺癌病理图像的训练,在所选用的预训练数据集上做迁移学习的效果要优于第一部分研究中不做迁移学习,也优于传统方法中在Image Net上做迁移学习的情况。3)基于弱监督学习的乳腺癌病理图像识别研究。为解决前两部分研究中二次标注过程费时费力的问题,针对乳腺癌病理图像,给出一种在弱监督设置中对整个图像进行像素分辨率分割模型训练的新方法。使得模型可以在嘈杂的标记数据下进行训练。首先,通过关注模型置信度较高的区域,利用模型的已学习经验随机动态采样。其次,使用扩展的KL(Kullback–Leibler divergence)发散,该扩展对噪声标签是可靠的。在CAMELYON 16数据集下验证结果,最终取得ROC下面积0.916的成绩。相较于传统全监督学习方法,该方法牺牲约3.37%的准确性,获得了约30.6%的研究时间效率上的提升。