论文部分内容阅读
通常人们在面对复杂场景时会优先注意最重要和最感兴趣的区域,视觉系统能快速从复杂场景中提取出该区域。显著性目标检测作为图像分割,图像分类,视频追踪,图像压缩等众多复杂任务的预处理关键环节,能有效捕捉到视觉显著性区域。其通过一定的算法或者模型模拟人脑视觉系统判断出图像中每个像素属于感兴趣区域的概率,在不同的衡量标准下评定每个像素的类别,最终输出场景的显著性图。深度学习网络近几年在图像分类,目标检测,场景稀疏等方面取得不错的效果,这源自于深度架构强大的表达能力和容量:学习复杂特征的能力和直接学习训练样本之间相互关系的模型。这打破了过去传统人工选取特征的方式,大大推进了显著性目标检测的发展。早期用于场景稀疏和显著性检测的深度学习网络由于将图像块作为网络的输入,网络结构无法获取远程标签依赖关系,而通过循环学习的方式使得图像上下文信息越完善网络越成熟。本文通过总结现有的显著性科研成果和结合当今前沿的科研技术,提出了一种基于深度神经网路的局部估计和全局搜索相结合的图像显著性检测方法。本文所提出的模型分为三个阶段:局部阶段,全局阶段,局部和全局融合阶段。局部阶段包括局部估计网络和局部优化阶段。运用局部估计网络来学习局部图像块的特征,判定局部图像块中每个像素属于显著性的概率大小。获取局部初始显著性图后,由于局部估计网络对于高频噪声敏感,无法获取图像空间连续性,为了解决这个问题,本文采用GOP优化算法提取一系列的目标分割区域,优化局部估计阶段的显著性图。全局阶段包括全局搜索网络和全局优化阶段。全局搜索网络通过获取整张图像的对比度和几何信息作为图像的全局特征,以此判定图像显著性像素的概率大小。为了弥补全局网络丢失的部分前景信息,本文采用基于颜色-距离的传播算法对网络进行优化,得到全局优化显著性图。局部和全局融合阶段利用最小二乘法学习最优权重将二者进行线性组合,输出最终的显著性图。通过在显著性公开数据库上测试,本文所提出的算法不论是局部,全局阶段还是融合阶段,都具有较好的检测性能。与其他十种现有最优的算法进行比较,我们所提出的算法无论是准确率-召回率曲线(Precision-Recall Curve)还是F-measure-AUC柱状图都表现出较好的性能。表明了论文所提出的算法能较全面而准确地突出了显著性目标。