论文部分内容阅读
医学影像是当今临床医学中极其重要的工具。近年来,随着各种成像系统的发展,极大地提升了医学图像的适用性和重要性,并且产生了大量的医学图像信息。尽管产生医学图像的成像系统已经有了很大的改进,但所生成的图像无一不存在着噪声。噪声覆盖遮掩、并降低了图像中某些特征的可见性,从而降低了图像质量并影响后续的应用。因此,图像去噪算法可以提高受到噪声干扰的图像的质量。另一方面,由于在后续医学图像研究中的重要性,医学图像的目标检测方法算法受到了越来越多的关注。医学图像的特征在不同病人之间是不一致的。例如,每个患者的肿瘤组织的大小、形状和位置都不相同,甚至在单个患者的同一张图像中的两个肿瘤也是如此。类似地,它们的相关性也在变化,医学图像中的检测不仅依赖于局部特征,并且依赖于整张图片的和全局特性。由于这些不同,医学图像的目标检测是一个具有挑战性的问题,有一些目标往往会被医生忽略掉。因此,除医学图像的去噪任务外,医学图像的目标检测算法是另一个值得研究的领域。本工作的重点是医学图像的去噪和检测任务。去噪是医学图像诊断的第一步,也是至关重要的一步,而检测对于后续的过程(如分割、配准和诊断)至关重要。本文第一部分介绍了两种利用深度卷积神经网络(CNN)进行医学图像去噪的方法。对于底层视觉任务,网络的深度是非常关键的。但是,随着网络深度的增加,存在梯度消失的问题,这影响了网络的性能。为了解决这一问题,我们提出的第一种去噪技术是基于残差学习的去噪卷积神经网络(DCBN-Netr)。我们同时考虑网络深度、学习算法和归一化方法,设计了一种前馈去噪CNN。相应地,我们采用残差学习方法,使用批量归一化作为正则化方法对医学图像进行去噪。更具体地说,与大多数基于CNN的直接学习潜在图像的去噪方法不同,残差学习不学习潜在的清晰图像而是学习图像噪声,然后无噪声的图像使用含噪声图像减去估计的噪声来得到。在深度网络中采用残差学习和批量归一化技术,既加快了训练过程,也提高升了去噪的性能。实验结果表明,该模型将重建图像的平均质量提高了0.1d B至0.9d B。我们提出的第二种技术通过在CNN中间层引入特征图平滑约束,创新地提出了一种带有特征图平滑约束的去噪网络(FMSCD-Net)。首先,我们分析了清晰医学图像的CNN中间层feature map的统计特性,验证了中间层feature map具有平滑特性(如梯度特征明显,以零值为主)。由于噪声的存在,在医学图像的特征图中,这些平滑特性遭到了破坏,在基于CNN的去噪过程中,我们发现去噪后的图像质量有所退化。为了保持退化图像的网络特征图的平滑特性,我们引入了一种新的平滑约束。给定一个feature map,其中的每个值的平滑性属性都通过其邻域像素的加权求和来保持。这些权值根据两个连续的感受野的相似性计算得到。其次,利用这种平滑约束,我们设计了一种直接逼近潜在清晰图像的端到端网络FMSCD。这些受约束的特征图有助于训练更深的网络结构,并提高重建图像的质量。最后,我们将残差学习和批量归一化方法集成到FMSCD中,进一步提高了模型的性能。实验结果表明,该方法将重建图像的平均质量提高了0.01~1.1d B。论文的第二部分介绍了两种基于多路径卷积神经网络的医学图像检测方法。两种模型的目标都是解决基于肺部CT图像的肺癌的检测问题。肺癌是癌症相关死亡的主要原因。与其他癌症一样,早期筛查是肺癌诊断和治疗的重要环节。在CT图像中的存在的肺结节并不一定为癌症,结节的形态、大小和上下文信息都与癌症有着复杂的关系,因此肺癌的筛查需要仔细分析每一个可疑结节,并整合所有结节的信息。为了解决这个问题,在第一个模型中,我们提出了一种用于肺癌检测的多路径卷积神经网络(MP-CNN)。首先在预处理阶段,我们改进了U-Net来生成可疑结节,生成的结节成为第二阶段的输入数据。该第二阶段中的模型是一种多路径CNN,其同时利用局部特征和全局特征用于检测肺癌。为此,模型使用了三条路径,每条路径使用不同的感受野大小,这有助于对长距离的依赖关系进行建模。然后,为了进一步优化我们的模型性能,我们将这三条路径产生的特征图进行合并。最后,我们还引入了一个再训练系统来能够解决与图像标签不平衡的问题。最终该模型检测精度达到87.8%。第二种肺癌模型是采用高效的特征融合策略设计的“先去噪”双路径卷积神经网络(DFD-Net)。首先,利用基于残差学习的去噪网络(DCBN-Net)对CT肺扫描图像进行去噪处理。该去噪网络由卷积层和批处理归一化层组成,用于学习残差而不是潜在的原始图像。之后将去噪后的结果作为输入,采用双路径卷积神经网络完成来处理检测任务。这两条具有不同大小感受野的路径分别用于对局部特性和全局特性建模。第三,为了进一步改善模型性能,不同于直接将来自不同CNN层的两组特征拼接在一起的传统特征拼接方法,我们引入相关性判别分析方法来拼接更具代表性的特征。我们发现这类模型能够出色地降低图像中的噪声,平衡感受野的大小,并且提供更具代表性的特征,使我们的模型更适应结节形状和大小的变化。实验结果表明,该模型检测精度达到88.3%。