论文部分内容阅读
感兴趣的物体检测和分割(统称为感兴趣物体的提取)一直是计算机视觉、图像理解和模式识别等研究领域的重要关注点之一。它在物体识别、基于内容的检索、基于内容的图像和视频编码与压缩以及视频监控等等领域有重要的应用。传统的感兴趣物体提取方法常常将感兴趣物体假设为在自然图像正中央的物体,或者是图像中比较显著的物体,这种弱假设往往忽略了感兴趣物体具有主观性的性质,所以适用的范围不大。受人脑处理这一问题所采用的策略的启发,我们提出了基于样本学习的方法定义感兴趣物体,从而避免了原来弱假设所带来的目标模式不清晰的问题,也引出了本文的主要方法。本文提出了一种新颖的从自然图像中提取感兴趣物体的框架。本框架包含两个主要的阶段:(1)学习阶段。此阶段通过样本学习的方法定义感兴趣物体并提取与之相关的先验知识(包括物体形状信息以及物体表观信息)。在此阶段,我们从大致对齐的感兴趣物体的正样本中,学习一个关于此类物体的活动基模型和对应的形状草图模板,同时对物体的表观信息进行统计,获得感兴趣物体的形状和表观先验信息。(2)提取阶段。此阶段将感兴趣物体的先验知识应用到统计推理机制中,综合检测和分割进行感兴趣物体的提取。在此阶段,用学习得到的活动基模型作初步检测以确定候选区域。然后,我们对候选区域进行基于统计马尔科夫链蒙特卡洛推理方法的图像分割,并通过选取具有最大后验概率比的分割结果作为最佳输出结果。本方法中的两个阶段有机的结合在一起,构成了一个整体:在学习阶段获得的先验知识可以使目标模式(感兴趣的物体)更明确,并能指导提取阶段的统计推理过程。因此,该方法能较精确的提取感兴趣的物体。在公共数据集上测试的结果也表明了我们提出的方法表现比当前最好的算法所得到的结果还要好。作为总结,本文的主要创新之处如下:1、提出了一个新的关于感兴趣物体提取问题的框架性解决方案。与传统的依赖弱假设对感兴趣物体位置初始化的方法不同,我们引入了感兴趣物体的先验知识的学习机制,从而清晰的定义了目标模式,提高了感兴趣物体的定位准确度,同时更加符合人脑搜索感兴趣物体的机制。2、提出了一个新颖的用离散草图约束连续区域边界的方法,使近似的衡量基于离散Gabor小波表示的活动基模板与连续的区域边缘轮廓之间的相似性成为可能。3、创造性的将感兴趣物体学习得到的先验知识嵌入先验和似然模型,从而大大提高了基于统计推理的感兴趣物体提取的精确度和计算效率。