论文部分内容阅读
图像分割算法在过去的20年中快速发展,经典的图像分割算法都是针对一张图片的,利用一张图片内部的颜色分布、边缘强度、视觉显著性等低层视觉特征进行分割。2006年开始提出并广泛研究的协同分割算法则协同地考虑共享前景的多张图片的分割。协同分割目标是在一组共享前景的图片中通过约束图片与图片之间前景的相似性提高分割的精确度。协同分割带来的另外一个好处是把不同图片的分割联系到一起,使得具有相似特征的物体具有一致的标号。在计算机视觉领域,在视频中分割出目标物体一直是一个非常重要的问题,通过分割得到一个物体的形状以及形状的变化是十分有益的。一方面,物体具体的形状为识别等问题提供了重要的线索,另一方面,分割保留前景目标的区域而去除背景的干扰,相对于固定形状窗口是更加准确地表示,很多研究都表明通过图像或视频的分割能提高目标识别、目标跟踪等经典视觉任务的准确性。如何联系视频多帧分割以保持视频分割的时域一致性一直是一个重要的问题。经典的视频分割算法通过相邻帧的运动估计保持像素间的映射关系,虽然在诸如背景一致或前景运动不太剧烈的场景取得良好的效果,但是对于前景目标运动特别剧烈而无规律或视频时域采样率较低的情况则不太理想。本文首先回顾了经典的基于运动估计和时域对应关系的视频分割算法以及近年广泛研究的基于约束图片间前景一致性并联合优化的图像协同分割算法。在此基础上,本文在视频序列区间上定义了一个联合能量函数,包含单帧分割质量以及协同分割约束。其中协同分割约束用神经卷积网络特征空间中的一个超平面对视频的前景与背景建模,并度量序列区间前景背景的相似性,从而建立分割时域一致约束。针对能量函数的定义,能量最小化利用时空参数化图割通过在一个缩小的分割标号空间迭代的方式进行。针对所提出的协同分割约束,本文在实验中与基于视觉显著性的单帧分割相比较,体现出协同分割的约束对视频前景背景分割精确度的提升。针对能量函数中的协同分割约束在视频序列区间中的学习,本文进一步将所提出的视频协同分割问题转化为一个传递式学习的问题。本文首先回顾了经典的传递式学习算法。考虑到视频前景可能具有多种不同的变化过程和不同的形态,本文描述了一种多分量的视频协同分割算法。在该算法中,一棵“时域树”在视频的时域建立起来,时域树的每一个叶子对应一帧视频,每一条从根节点到叶节点的路径为视频的一个连续变化的分量。对于每一个分量,都对应一个渐变的前景背景模型。本文还讨论了不同分量对应模型之间的关系。在实验中,本文比较了基于最大期望式迭代的视频协同分割算法与基于时域树的多分量视频协同分割算法,体现出多分量模型对前景变化较大视频的鲁棒性。本文还在实验中比较了所提出算法与最近的视频二值分割算法和协同分割算法。本文提出的算法在分割准确性上超过了很多视频分割和协同分割算法,并对于前景物体运动特别剧烈的情况比较鲁棒。