论文部分内容阅读
视频运动目标检测是计算机视觉和视频图像处理领域一个重要的研究课题,在军事、医学、商业以及工业等各大领域都有广泛的应用前景。视频运动目标检测的本质是对摄像机采集的视频进行处理,把运动的目标检测出来。视频运动目标检测是对视频图像进一步处理如目标跟踪、目标识别和行为理解等的基础,然而由于视频图像在采集的过程中受到摄像机抖动、光照强度变化、复杂背景、目标遮挡等干扰因素的影响,导致运动目标的形态发生改变或短暂消失,为运动目标检测增加了难度。因此,如何把运动目标从复杂的背景中快速、准确地检测出来已经成为目前急需解决的问题。随着视频压缩编码技术的发展,本地存储和网络传输的视频大多是经过压缩编码的视频码流,所以针对压缩视频的运动目标检测技术受到了广大学者和科研工作人员的关注。H.264是目前应用最广泛的视频编码标准,具有压缩性能高、网络适应性好、图像清晰度高等特点,涉及的领域越来越广泛。H.264视频压缩码流中包含高精度亚像素表示的运动矢量,该运动矢量表征视频图像的运动趋势,利用该运动矢量进行运动目标检测可以提高检测的准确性、加快检测的速度、增强检测系统的稳定性。因此,对H.264视频的运动目标检测技术进行研究不仅顺应时代发展,而且具有重要的理论和现实意义。论文对H.264视频的运动目标检测技术进行研究,并采用VC++编程语言对其进行实现,主要的研究工作和成果如下:1.针对解码H.264视频压缩码流中包含的运动矢量,考虑到H.264视频编码标准采用树状结构运动补偿的宏块分割模式,对其进行解码,得到的运动矢量场比较混乱,不利于分析和处理,对H.264解码器的解码运动矢量模块进行改进,以4×4宏块为单位记录运动矢量,建立均匀分布的运动矢量场。2.针对含有噪声干扰的视频,采用时-空域相结合的滤波方法对运动矢量场进行滤波处理,首先在时域,采用多帧运动矢量场累加的方法抑制干扰噪声,然后在空域,采用拓展的矢量中值滤波法对累加运动矢量场进行进一步的处理,最大程度上减弱噪声对检测结果的影响。3.针对阈值选取问题,对最大类间方差法进行改进,得到改进的直方图统计法计算自适应迭代阂值,避免手动设定阈值过大或过小导致的漏报或误报现象。4.针对需要确定运动目标细节信息的应用场合,采用邻近宏块搜索法对运动目标进行标记,保留运动目标的完整信息。为了验证H.264视频的运动目标检测的性能,论文进行了大量的实验,不仅包括静态简单场景下的运动目标检测性能的测试,而且包括动态复杂场景下的运动目标检测性能的测试。实验结果表明,论文实现的运动目标检测技术能够较为准确地检测出运动目标,并且具有很好的鲁棒性和实时性。