论文部分内容阅读
近年来,借助深度学习的迅猛发展势头,计算机辅助诊断技术在临床工作中展现出强大的生命力。医学图像分类作为计算机辅助诊断领域中应用最为广泛的一门技术体系,可以实现对医学图像中病症的筛查和病灶的检测分类,对于人类健康福祉具有重要意义。然而,现有的医学图像分类方法多数为依赖于有完整标记数据的有监督学习过程,而医学图像数据的人工标注过程往往需要投入大量的时间和精力,并且即便是行业内部人员的标注也难以避免标记产生的噪声问题,这给无疑给研究工作带来诸多局限。基于无监督和半监督框架的医学图像分类方法能够突破有标记医学图像资源稀缺所带来的研究困境,但至今为止此领域的研究工作尚不成熟,存在一些问题瓶颈。本文以可用有标记医学图像数据匮乏的问题为切入点,开展无监督与半监督框架的医学图像分类关键技术研究,针对临床工作中特定的医学图像分类问题以及其固有的随机性和特异性,探讨并验证有效的分类方法,切实提升临床医学图像分类诊断水平。本文的研究内容与贡献概括如下:1.提出了一种基于自监督拓扑聚类网络(Self-supervised Topology Clustering Network,STCN)的无监督皮肤癌图像分类方法,针对临床实际医学图像因光照、对比度、角度及背景干扰等因素导致的不确定性和复杂性,构建了对于图像具有变换不变性的自监督网络,该网络可归一化多变条件下的医学图像,增强所提取特征的鲁棒性;为了解除现有大多数无监督医学图像分类方法中样本拓扑关系单一固化的问题,设计了深度拓扑聚类模块,通过模块度最大化机制实现在不知类别数目的无标记数据中完成自动聚类过程,有效地解决了在训练过程中偶发的新类别问题;最终通过自监督训练过程优化整个网络的分类性能。本方法在无需预知样本类别信息的条件下提取的特征具有良好的聚类划分能力,获得了较为理想的无监督皮肤癌医学图像分类效果,且在性能表现上优于现有聚类方法。2.提出了一种基于原型迁移生成对抗网络(Prototype Transfer Generative Adversarial Netowrk,PTGAN)的无监督乳腺肿瘤图像分类方法,针对由于数据采集设备、参数设置的不同,导致的乳腺肿瘤图像在风格、数据分布上的差异问题,设计了目标域偏向生成对抗网络,通过域判别器与生成器的对抗训练过程使得经过生成器重构后的源域图像与目标域图像之间的风格差异不断减小;为了解决乳腺肿瘤图像分类任务中有标记数据稀少所导致的算法效率和扩展性难于提升的问题,构建了原型迁移模块,通过跨域特征迁移损失对网络提取的特征进行进一步迁移,对特征空间中的跨域特征分布差异进行消除;采用从源域数据集中学习的基于原型的分类器来对目标域中的样本以聚类中心最近邻规则进行匹配,并获得对应的伪标签,进而达到在类别层面上减小域之间的分布差异,最终实现对目标域中无标记样本类别的划分。本方法对于不同放大倍数下的无监督乳腺肿瘤病理图像二分类任务获得了87.6%的平均准确率,且具有良好的扩展性。3.提出了一种基于多源模糊注意力网络(Multi-source Fuzzy Attention Network,MFAN)的半监督乳腺肿瘤图像分类方法,针对该领域有标记数据资源稀少与现有同类无监督分类方法效果不理想的问题,设计了域注意力特征提取器和域不变性生成器,利用目标域中少量的有标记图像和大量的无标记图像,以及多个相关源域的有标记图像来学习一个乳腺肿瘤图像自重构模型;考虑到不同域数据对向目标域迁移的贡献度不同,引入模糊聚类算法进而获得不同域的权重,将每个域的图像特征转化为偏向目标域的公共特征空间;引入了图像解码器(生成器),通过与相对判别器的对抗训练过程,以达到进一步提高特征鲁棒性的目的;最终模型采用K-均值聚类算法为样本标注相应的伪标签,通过标签推理过程以实现在学到的共享特征空间中训练目标域数据的分类模型。本方法中的MFAN网络机制可有效提升半监督乳腺肿瘤图像分类任务的分类精度,能够准确估计相同类别的样本,降低临床应用中乳腺癌的漏检率。4.提出了一种基于深度多特征增强网络(Deep Multi-feature Reinforcement Network,DMRN)的半监督脑影像分类方法,针对深度学习技术在磁共振脑影像分类研究方法中仍存在的有标记训练数据支撑不足、模型可解释性差,以及无法有效提取医学图像的特定手工设计特征等问题,本方法在特征提取模块提取图像的深度特征后,又采用局部二值模式提取具有旋转不变性和灰度不变性的纹理特征,并通过广义线性模型提取形态特征;在多特征增强模块实现对深度表示特征与以上两类手工设计特征的融合,并引入反卷积操作重建网络,对融合后的特征进行影像重建,提高综合特征对原始图像的表示能力;最终应用分类模块对增强后的图像进行分类。本方法能够充分利用有标记和无标记脑影像的各类特征信息,相较于已有的半监督脑影像分类方法具有更优异的特征学习能力及分类性能,且与现有的有监督方法的性能表现差异保持在一定限度之内。