论文部分内容阅读
如何从背景复杂的视频中较为准确地分割得到目标是视频分割研究领域的一个重要问题。目前对视频分割算法的研究已经越来越广泛,主要存在着两大类的分割算法,分别是基于背景建模和基于目标识别的分割算法。前者对光线变化、摄像机位置的变化以及焦距变化等动态变化较为敏感,只有当这些变化不存在或是轻微存在时才能对背景进行正确的建模。后者在前者的基础上发展起来,虽然对摄像机的移动与否不做要求,但需要事先对特定目标进行训练。于是我们希望能够在摄像机位置不固定,又不需要事先对目标样本进行训练分类的情况下准确地获取目标的分割。本文提出了一种基于四元小波变换的动态时空域显著模型,能够自动将显著目标物体从运动的背景中分割出来,同时满足了上述两个条件。第一步,本文首先构造四元图像金字塔,在图像金字塔的迭代过程中抽离出每个分辨率等级上像素点的细节信息和近似信息,并利用这些信息计算相应相位差,从而求出目标物体的运动幅度,得到基于运动差的运动幅度显著模型。然后根据运动场特征建立基于运动场特征的显著模型,将两个模型结合得到了基于运动显著性特征的时域注意力模型。第二步,本文以小波参数对应的点为中心位置,构造了一个中心区域和相应的周围区域,并用Gabor滤波器计算中心-周围区域对比能量,并利用对比敏感度函数调制出该中心-周围区域对比能量的权重值,并用逆四元小波变换处理权值,计算出图像的色彩显著性,从而建立基于色彩敏感度的静态空域模型。第三步,本文根据一定的标准将上述两个独立的模型合理结合起来,得到一个有效的动态时空域混合模型,并借助Grabcut算法对二值化分割结果进行优化,使分割效果更加精确。最后为了说明算法的效果,用测试视频进行对比实验,实验结果表明本文提出的基于四元小波变换的动态时空域显著模型具有较高的准确率和较好的适应性,因此具有可行性。在上述工作中,我们最后采用Grabcut算法对初步分割结果进行优化,从实验结果中可以发现该优化取得了不错的效果。由于现在很多分割算法是在像素级别上对图像进行分割计算的,当目标和背景之间的颜色反差不大,算法会判定原本的两个分别位于目标和背景中的相邻像素点属于同一目标或是同一背景的可能性较大,导致这两个像素点被分割的可能性较小,从而无法准确分离目标和背景。并且由于每个像素点都构成加权S T图的节点,随着节点数的增加,计算量和存储量都相应的成倍增加,导致了较大图像分割速度较慢的现象。因此,本文提出了一种基于超像素和Graphcut框架的优化分割算法,事先对待分割的视频帧图像进行预处理,得到多个区域一致性和边缘描述性较好的小区域,即为超像素。接着利用模糊c-均值聚类处理所得超像素,得到待分割图像帧的初步显著分割效果图。最后,本文基于Graphcut框架进一步对分割结果进行优化,在超像素的基础上求解某个超像素的运动显著能量和色彩显著能量,从而得到基于超像素的能量函数计算公式。并利用最大割/最小流算法最小化能量函数,求解得到能量函数的最小值和较为精确的边界分割,填补了前面得到的显著分割图所缺失的部分,使得分割边界更加的平滑准确。同样地,为了说明算法效果,我们用一组测试视频帧图像进行对比实验,结果表明基于超像素和Graphcut框架的优化分割算法相较于其他算法而言具有较明显的时间和准确率优势。同时我们从漏分率和错分率两个方面对算法的准确率作了定量计算和比较。