论文部分内容阅读
近年来,压缩域视频运动目标检测应用受到广泛的关注,由于其具有检测速度快、实用性强而被应用于多个领域,如多媒体、人机交互等。针对视频源的处理方式来分,目标检测包括像素域和压缩域的方法。像素域的方法主要利用图像本身和图像间的相关性进行处理分析,而与像素域目标检测相比,压缩域目标检测方法主要是利用压缩码流中可用编码元素如运动信息和残差图像信息进行运动特征提取,不需要对码流进行全解码。研究者针对MPEG-X/H.26X等不同压缩标准的视频码流目标检测提出了许多方法。本文在分析总结当前像素域和压缩域目标检测方法的基础上,针对MPEG-X/H.26X压缩码流,设计了结合编码元素的静止背景运动目标检测的通用框架;通过对运动镜头建模检测运动拍摄背景下的运动目标。本文的研究成果包括:对MPEG-X/H.26X系列视频压缩标准中的码流信息及语义进行了全面统一的分析,特别是语义如何与实际图像内容对应,不同的码流信息如何提取进行了比对,为接下来的目标检测方法提供理论基础;在静止摄像机拍摄场景下,针对基于编码比特流统计特征的目标检测方法进行了改进,引入了像素域的边缘检测方法检测边缘宏块,同时对空时域滤波进行了改进,减小了滤波计算复杂度;针对运动摄像机拍摄场景下的目标检测,考虑到采用传统的全局摄像机运动估计的精确度低、迭代计算量大的不足,而采用生成区域运动矢量场的镜头运动模板方式,用镜头运动模板匹配背景运动宏块的方式来区分背景宏块,并通过概率场累积模型的方法精炼前景检测结果。