论文部分内容阅读
视觉显著性是视觉中非常重要的一部分,它通过过滤人们视野中大量信息中的冗余部分,从而减少对信息的处理。另外,由于人们感兴趣的目标总是有能够区分它周围的某些特殊的性质。这种机制也能帮助选择一个场景中人们最感兴趣(显著的)的目标。近年来,学者们对显著性目标检测技术进行了广泛的研究并提出了许多新的方法。显著性检测技术的快速发展使它广泛用于分割,分类,基于内容的检索等图像领域中。显著目标通常是独特的,稀缺的,奇异的和难以预测的。针对它的这些特性,许多显著性检测模型(像纯计算模型,基于生物学的模型,或者是对两者结合的模型)已经被提出。由于显著目标在自然场景中是趋于稀疏的,稀疏表示方法已经被用到显著性检测当中,但是已有的基于稀疏表示的检测方法往往更趋向于突出显著目标的边界而不是显著目标本身,尤其当图像中显著目标比较大时,这种情况更加明显。本文提出一种新的显著性检测方法。给定一幅图像,首先把它分割成超像素,并用简化的谱分割方法把这些超像素再聚合成几个尺度更大的分割。然后结合稀疏编码理论采用一种中心-剩余方法(即以每个超像素为中心,不包含该超像素的剩余分割中所有超像素为字典)来重构超像素。这个过程具体描述为:对给定的一个分割,它所包含的每一个超像素被表示为在其他分割中所有超像素的线性加权和,然后平均每个分割的重构误差值作为超像素的初始的显著值。这种分级分割的策略有效解决了之前稀疏表示的方法不能很好突出目标内部的问题。最后,区别于传统的分别计算每一种特征的显著性图,然后将它们简单联合的多特征显著性检测方法。本文以排序模型为标签推导框架,定义了一个多特征匹配项,通过在多种特征空间的联合推导来融合特征间互补性,进而提高显著性检测效果。为了对本文算法进行客观的评价,本文在四个公开图像库中进行大量的测试,并与目前15种提供源代码的算法进行了比较,从实验结果看,本文提出的方法在召回率和准确率上都获得明显的优势。