论文部分内容阅读
解剖学和组织病理学的分割是临床进行医疗诊断的首要依据。医学图像分割作为医学图像处理与分析领域最为复杂且关键的任务,其目的是在噪声大、病灶区域纹理不明显的图像中将具有特殊含义的区域分离出来,并高效的提取相关区域的特征。但由于医学图像本身的高度复杂性,表现为缺少简单的线性变化、噪声变化较大以及像素灰度分类不确定等特点,这导致了图像病变区域在边缘纹理分割和细粒度特征提取任务上受到限制。近年来,基于深度学习技术的网络模型已经远远超过传统的图像分割技术,在各类图像任务上表现优异,但目前大量的图像分割模型仅依靠拓展网络深度进行特征提取的方式使得模型架构尤为复杂,模型的训练往往需要大量的迭代且泛化能力较低。针对上述问题,我们提出一种基于双重注意力机制的复合网络模型CA-Net(Composite Attention Network)架构。它包含一个3D主干网络编码器来进行特征提取,一个加入通道注意力块的3D解码器用来生成空间范围的语义一致性像素区域,另外我们还引入边界注意力机制网络来更好地融合低维特征图边缘信息。与此同时我们在三个模块间添加了密集连接,一方面为了防止重要特征丢失,另一方面以更好地融合多种尺度特征。本文主要针对于三维医学图像的分割任务,通过混合注意力机制以提升模型的分割精度,主要研究内容如下:(1)医学图像特点和医学图像分割的背景综述。首先对近几年图像分割方法的发展情况进行阐述,介绍了传统分割技术以及基于深度学习分割技术的图像分割方法的优缺点。(2)针对目前医学图像数据复杂性的问题,本文提出了针对3D医学图像的预处理技术和图像增强方法。其中图像增强采用基于传统数据增强以及基于生成对抗网络的两种增强方式,探索两种增强方式对实验效果的影响。(3)为解决2D模型对3D医学图像的不适用问题,本文提出全新的医学图像分割架构。模型架构主要包含三部分,第一部分提出一个含有较少学习参数的3D编码器,用于对图像进行特征提取。第二部分设计了一个含有通道注意力机制的3D解码器,用来生成空间语义一致性的特征。第三部分提出一种空间边缘注意力机制网络,以编码器初始阶段特征作为输入,用以更好地提取图像的边缘特征。(4)为防止特征信息在网络信息传输过程中引起丢失,本文在各模块之间采用密集连接方式,以提升网络的分割效果。(5)最后本文在三种不同医学图像上进行相关实验以证明所提出模型的有效性和模型本身的泛化能力。