论文部分内容阅读
近几年来,人工智能技术发展迅猛,其中的深度学习技术被广泛应用在智能机器人、语音识别、图像处理等多个领域,而且充当着关键的角色。以图像语义分割为例,基于深度学习的分割算法不需要人工设计特征,而且能较好地提取图像中深层的信息,因此得到众多研究人员的青睐。在基于深度学习的语义分割算法中,神经网络是最重要的部分。一般来说,网络模型的层次越多,其提取特征的能力便会更强。但是,随着层次的增多,网络中提取的特征便会越抽象,其中忽略掉的细节信息便会增多。本文以经典的DeepLab-LargeFOV网络模型为基础,提出了几种优化方法,并通过实验证明了新方法的有效性。本文的主要贡献如下:(1)利用共享式特征融合结构的特点,对网络模型中的深层特征进行多尺度特征融合优化。并且探究和优化各种不同的多尺度特征融合模型,从而得到最佳的多尺度特征融合优化方案。(2)进一步对多尺度特征融合模型进行全局特征优化。通过探究多种全局特征融合的方式,以及对现有的一些全局特征融合方法进行优化,找到最合适的全局特征优化方案,使深层特征对图像的全局表达能力变得更强。(3)提出了一种基于中间层特征的跨层式特征融合方法,对经过上采样处理后变粗糙的输出图像进行优化处理。其特点是基于中间层特征的融合优化,并非一般的基于浅层特征的优化手段;优化方式是特征级别的融合,而不是简单的热度图融合优化。(4)提出了一种基于浅层特征的局部相似性约束优化算法,利用浅层特征的局部相似性,对网络输出的热度图作结构性优化。通过对比实验,找出了最适合的浅层特征作为优化材料以及最佳的局部关联特征提取方式,进一步增强了该算法的优化效果。通过将原始模型与本文的优化模型进行对比实验,证明了本文的优化算法可以较好地提升该网络模型的语义分割性能,并优于结合全连通条件随机场的后处理优化方式。