论文部分内容阅读
人类在理解图像或者视频的时候,其视觉注意力系统能够快速定位到最引人注目的对象,该类对象通常被称之为显著对象。近年来,从图像或视频中自动检测和分割出显著对象,一直是计算机视觉领域的研究热点。本文进行了显著对象检测算法的相关研究,提出了基于超对比度的显著对象检测算法、基于场景分类的显著对象检测算法,基于对象边界的显著谱增强算法以及基于深度卷积回归网络的显著谱质量评价算法。具体的研究内容和创新点包括如下几个方面:第一,传统的基于对比度的显著对象检测算法通常将对比度值较高的区域当作显著对象,该类算法通常只能检测到显著对象的一部分。为解决该问题,提出基于超对比度的通用显著对象检测原理:相异度产生对比度,而对比度导致显著性。遵循该原则,提出基于超对比度的显著对象检测通用框架。所提框架能够灵活地整合不同类型的区域相异度定义,区域上下文和对比度变换。实验结果表明所提方法在四个数据集三个测度方面均优于现有基于对比度的算法。第二,显著对象的类别、位置和尺寸在不同的图像中均存在较大差别,而大多数的全监督算法都致力于训练单个显著对象检测器,并将其应用到所有的测试图像中。当测试图像中显著对象的类别、位置或比例与训练图像有较大差异时,该类算法极易产生错检。为解决该问题,提出一个场景自适应的显著对象检测算法,致力于为每个测试图像应用场景自适应的显著对象检测器。此外,还提出一种基于高阶项的联合优化框架来共同学习场景类和显著对象检测器,该优化框架在保证相同场景训练样本之间相似性的同时惩罚特定场景下的困难训练样本。第三,为增强显著谱的质量,现有的显著谱增强算法通常使用基于邻域约束的平滑模型,该类模型倾向于为相邻区域分配相似的显著值,该特性极易在对象边界的相邻区域引入新的错检区域。为解决该问题,提出基于对象边界的迭代优化框架来改善显著谱的平滑度,并同时纠正对象边界两侧的错检相邻区域。该优化框架引入了一个潜在分割变量来约束增强显著谱和潜在分割掩模之间的一致性,其目的是同时惩罚位于显著对象边界外的高显著值和位于显著对象边界内的低显著值。实验结果表明所提算法在三个数据库上均优于现有的显著谱增强算法。第四,高质量的显著谱在推动许多其他计算机视觉任务方面发挥着重要作用,为评估显著谱的质量,唯一的方法是利用人工标记的参考显著谱,即通过比较参考显著谱与预测显著谱的一致性来计算预测显著谱的质量。然而在实际的应用中,参考显著谱的缺失导致大量的低质量显著谱被使用。为解决该问题,提出基于深度卷积回归网络的显著谱质量评价算法,用于在参考显著缺失的情况下,直接从显著谱预测显著谱的质量评分。此外,提出将深度显著谱质量评价网络应用于最优显著谱筛选和对象分割,实验结果表明该算法优于15个单一的显著对象检测算法。