论文部分内容阅读
在近几年中,大量科学文献从不同的角度探索机器视觉系统的运行机制,目的是为了使机器视觉具有人类视觉注意机制的能力。其中,显著性目标检测是计算机视觉中的一个非常重要应用。该应用目的是在图像中快速准确地找到人类第一眼注意的最突出的区域,即显著性目标区域。除此之外,显著性目标检测还应用在图像分割、图像分类,图像识别、图像检索、目标重定位、视觉跟踪等领域。当前显著性检测算法主要分为两个研究方向,一个是利用低级线索的自下而上目标驱动型模型,另一个是需要人工标注真值图并进行监督训练的自上而下任务驱动模型。本文采用的方向就是自下而上的显著性检测方法。基于自下而上和自上而下的显著性检测思想,人们提出大量的扩展算法。有的采用滑动窗口或者弹性边缘框的方式获取显著图,这会导致仅能够获取显著目标的大概位置,不能有效突出显著目标的轮廓。有的采用边界先验的方式,通过流形排序获取显著目标。但是,这样简单地把图像边界作为背景的显著性检测方法,势必会造成显著目标在图像边界条件下的误检。针对上述问题,本文提出了中心矩形构图先验的显著性检测方法,该方法首先从前景角度考虑显著目标多分布在图像的中心及其周围区域,用一个中心矩形框去覆盖图像的三等分区域,认为矩形框上的超像素为显著性种子,获取基于中心构图线的显著图。然后,同样的理论指导下,本文计算基于中心矩形构图交点显著值。接着,根据空间紧凑性关系,获取基于空间紧凑性关系的显著值。最后,使用高斯融合的方式把三者融合到一起,获取最终显著图。正是基于中心矩形构图先验的显著性检测的思想,本文又提出了矩形扩散的多尺度自寻式显著值检测算法。该方法是从前景角度,使用多个矩形框去覆盖原图像,并把矩形框上的超像素作为显著性种子,进行流行排序,获取基于矩形扩散的显著值。然后,从背景角度,对所有的超像素基于颜色特征进行权重排序,从中剔除可能是前景的种子节点,然后使用背景种子节点进行流行排序,并取反显著值,获取自寻式显著值。最后,把基于前景的矩形扩散显著值和基本背景的自寻式显著值进行线性融合,获取最终显著值。随着微软Kinect等立体相机的出现,RGB-D图像的显著物体检测技术吸引了越来越多的关注。每个RGB-D图像可以被分解成具有R,G和B颜色通道的彩色图像以及灰度级的深度图。在显著检测中,许多研究都集中在如何利用深度信息来补充颜色线索。有些人采用把RGB图获取的显著结果和深度图进行简单线性融合,这样并不能突出深度信息作用,效果并不很好。有人仍然把RGB-D图像的RGB使用常用的RGB算法处理,这样明显忽略了人类视觉系统在真实的三维环境中运作的事实。所以本文提出三维的RGB-D图像的检测性检测算法,该算法从三维角度提出了对RGB-D图像的检测。它将物体视为三维结构,重新定义了 RGB-D图像的边界概念,将实际三维环境中包括上,下,左,右,前,后平面在内的空间边界视为背景。它包含三维紧凑型特征,其中突出的物体通常具有三维紧凑的空间分布,通过颜色和深度特征来表示超体素之间的相似性,并且把六个平面应用流形排序生成六个显著图,从背景角度整合他们以获取RGB-D显著图。最后本文通过高置信度的显著种子从前景角度提炼显著图。本文针对 RGB 图像的处理,是在 MSRA-1000,CSSD,ECSSD,THUS-10000,SED共5个数据集上进行了测试。测试结果显示,较当前最先进的几种显著性检测算法有较大的优势。本文针对RGB-D图像的处理,是在NLPRRGBD1000数据集上进行了测试。测试结果显示,较当前最先进的几种显著性检测算法有较大的优势。