论文部分内容阅读
运动对象分割旨在从一个连续的图像序列中分割出运动的目标,是视频分析的基础,为基于内容的编码、视频检索、视频摘要提供重要的数据信息,并广泛应用于视频监控、视频制作等领域。自基于内容编码为特点的MPEG-4标准公布以来,运动对象分割技术的研究得到了更多的关注。运动对象分割大致可以分为两类:基于像素域的分割和基于压缩域的分割。像素域中一般是通过变化检测等方法来达到分割的目的,其分割结果较准确,但数据量大、计算复杂,对不同场景的分割适应性不强。随着编码技术的发展,压缩域运动对象分割受到了重视,压缩域中视频编码时产生的运动矢量和DCT系数是可以直接利用的特征信息,通过这些特征信息可以快速的提取运动对象,但由于编码以块为单位使得其分割结果不太精确。对于上述优缺点,目前鲜有研究将压缩域提取与像素域分割结合,以达到性能的均衡。H.264是最新的视频编码标准,以其良好的网络适应性和高压缩比的优点,受到了很大的重视,本文的研究工作就是基于H.264视频流的。本文基于压缩域与像素域分割的优缺点,采用了压缩域提取与像素域分割结合的方法。首先,通过H.264视频流中的运动矢量信息提取运动对象区域,然后把区域映射到像素域,在像素域通过马尔可夫随机场(MRF)模型或者Grabcut算法进行细化分割,得到准确的运动对象。本文的主要内容有:(1)对H.264压缩域中运动矢量预处理技术的研究。使用时域加权均值滤波与空域加权矢量中值滤波结合的滤波方法,并采用了累加、6参数全局运动估计、内插等方法得到可靠的运动矢量场。(2)采用基于运动矢量幅度、角度的差异度方法进行运动对象区域提取。(3)提出将H.264压缩域提取对象结果作为马尔可夫随机场(MRF)模型的初始标记场,在像素域中使用MRF模型对压缩域提取结果进行细化分割。(4)提出将压缩域提取结果作为像素域Grabcut的初始交互,并进行自动分割。经实验表明,本文采用的算法能自动有效的分割出运动对象,其分割结果较好,对静止背景序列和动态背景序列均适用。