论文部分内容阅读
图像的显著性检测是指使用计算机模拟人眼视觉注意机制的技术。主要任务是建立一个图像显著性检测模型或者算法,快速并准确地检测出图像中人眼最关注的区域。作为图像预处理的重要步骤,图像显著性检测对于众多传统图像处理任务的完成具有重要且难以取代的作用。为了比较深入的明确传统算法与深度算法的优缺点,本文在对国内外显著性检测领域的研究现状进行梳理总结的基础上进行了下面的工作。(1)由于FT算法在显著区域背景环境复杂,显著区域比较大时检测效果并不理想。根据人类更容易关注图像中心物体的特点,本文在FT算法的基础上进行了中心区域增强,LAB颜色特征值归一化,以及对LAB三通道信息进行加权等处理。通过对传统显著性检测模型的优缺点进行分析,本文发现虽然传统算法在检测速度上存在优势,但是在检测效果上存在很大的缺陷。传统算法难以满足强调最大显著对象,统一强调整个显著区域,为显著对象确立明确的边界,抵抗因纹理和噪音产生的高频信号,防止块效应等显著性检测的要求。(2)本文对现有的一些基于深度学习的显著性检测算法的特点进行了分析,本文发现现有的深度模型存在以下问题。首先现有的深度模型在卷积过程中需要对特征图进行池化。这导致特征图在卷积过程中逐渐变小,使得最后得到的显著图的大小与原输入图像大小不一致。同时现有的一些使用深度学习的显著性检测算法在网络模型的末端使用全连接网络,使得特征图的空间信息没有完全的使用,造成了空间信息的浪费。再者这些模型主要从网络末端的卷积层提取高级特征并进行非线性组合,但是由于缺乏物体边缘等低级视觉信息导致效果依然不是很理想。针对现有模型存在的问题,本文提出使用SEGNET作为基础网络实现显著性模型检测。本模型通过全卷积编码以及对应的解码很好的克服了现有算法显著图与原输入图像大小不一致与特征图的空间信息没有完全的使用的问题。通过构造一个对称网络,解决了池化过程中深度信息损失与缺乏对物体边缘等低级视觉信息进行有效利用的问题。通过对SEGNET图像分割网络的修改,本文将原本的基于交叉熵分类的图像分割网络变为了基于回归算法的显著性检测模型。接下来本文在THUS数据集和HKU-S数据集上对重新设计的网络框架进行迁移学习并进行对比实验。通过与其它显著性模型的对比实验,可以看出本文改进之后的算法相比其它算法具有相当高的优势,基本解决了上面提出的问题。