论文部分内容阅读
近年来,语义分割已经在自动驾驶、医疗图像分析、地质检测领域取得了长足的进步。随着计算机运算能力的日益增长,分割模型的实时性也可以得到较好的保证。这些领域基于完全监督卷积神经网络取得了丰厚的成果,但全监督神经网络需要利用大量像素级别的标注信息,而像素级别的标注信息需要大量的人工成本,因此基于弱监督学习的语义分割方法成为了新的研究热点。弱监督语义分割方法利用图像类别标注等非像素级的弱标签实现对图像进行像素级别的分割,因此如何利用弱信息标签找到图像中显著的目标区域是弱监督语义分割方法的关键。基于种子区域生长的图像分割方法是解决弱监督语义分割问题的一种思路,该方法首先基于类别标签生成种子区域,再对种子区域进行扩张,最终形成分割图。但该方法存在噪声类别输出以及语义信息不足的问题。基于上述的问题,本文对现有的种子区域生长语义分割方法提出了改进的方案。本文的主要工作如下:(1)针对类别激活映射方法仅能生成稀疏的种子区域问题,本文基于多尺度上下文信息的获取方法,提出了多尺度特征提取模型,并提出了不同尺度下的热力图融合方法。模型生成的热力图能够更加有效地捕获到目标区域,为后续模型生成更高质量的种子区域。(2)基于深度种子区域生长模型存在噪声类别输出与语义信息不足的问题,本文提出了噪声抑制分支与自注意力机制模块来缓解上述问题。改进后的模型能够更高质量地生成稠密的语义分割掩码,经过对比实验结果表明,本文提出的改进方案能有效提升模型的分割性能。(3)利用前文中模型生成的分割掩码作为伪标注信息,基于融合多尺度特征的编码器解码器分割网络,以重训练的方式获取端到端的分割网络,并在数据集上验证模型的有效性。