论文部分内容阅读
人工智能旨在应用计算机来模拟人的一系列认知。近年来,卷积神经网络在计算机视觉领域的应用取得了优异的成绩,特别是在物体检测、图像分割、目标跟踪等方面成效卓越。与目标检测不同,显著性检测旨在体现的是人的视觉观察点。基于深度学习算法的研究使得显著性检测从挖掘图像间的对比度关系,延伸至低级特征、中级特征和高级特征的提取与应用。借助卷积神经网络强大的特征提取能力,显著性检测的算法研究日渐深入,但现有的模型中,特征提取几乎无差别的考虑了场景中的所有特征,对于算法性能的提升产生了较大影响。如何构建策略提取图像中的有效信息,完整保留目标特征成为一个新的研究课题。本文以深度学习的多尺度融合网络为研究基础,引入注意力指导模块,设计新型多尺度融合网络。主要工作如下:首先,本文对显著性目标检测的研究背景及意义进行总结,对国内外的发展现状做了适当梳理,并引出本文研究工作的切入点。其次,对显著性目标检测和深度学习的相关背景知识进行了归纳,将深度融合网络作为重要的章节单独进行介绍。通过对前人研究工作的梳理和归纳,为后续本文工作的推进奠定了基础。然后,本文在深度融合网络基础上结合形态学操作进行适当的改进,分别提出了非局部注意力引导的多尺度融合网络(FNAsNet)以及深度可分多尺度感知网络(MSINet)。FNAs Net通过在高层中使用多尺度融合策略增加冗余信息来保证目标的完整性,非局部注意力模块在空间和通道两个维度对特征进行筛选,从而得到更有效的特征。MSINet对每层特征图中的目标边缘去除冗余,多分支感知结构实现了筛选后特征的融合。实验结果表明,这两种算法对于复杂场景的显著目标检测能够展现出一定的优势。本文中提到的算法均在六种公开数据集上完成了测试,实验结果表明,本文所提的算法具有较好的性能。