论文部分内容阅读
运动目标检测是智能视频监控系统中位于底层的关键技术,为上层的视频理解和智能分析奠定基础,在涉及社会公共安全的视频监控领域有着广泛的应用。经典的运动目标检测方法主要对空间域或压缩域视频进行处理,这类方法有效且满足实时性需求,但仍有不足,一是难以适应复杂情况下的监控场景,二是视频数据的采集、传输、处理与储存的成本很高,更鲁棒且数据处理成本更低的方法还有待提出。因此,本文基于压缩感知理论,研究针对“压缩感知域视频”的运动目标检测问题。本文的主要工作包括:(1)提出了一种基于张量分解与背景差分的运动目标检测方法,解决不同场景下压缩感知域视频的运动目标检测问题。本文在张量框架下研究视频背景在时空结构中更多的先验信息,即视频背景在不同模态、不同场景下的“差异低秩性”。在基于背景差分的视频分解模型的前提下,本文利用张量Tucker分解技术建模视频背景,并为Tucker分解引入“自适应秩约束更新”,最终得到一种改进的背景模型。新方法包含两个部分:视频重构与运动目标检测。实验结果表明,该方法不仅有效提高了不同场景下压缩感知域视频的运动目标检测的准确性,还进一步改善了视频帧的重构精度。(2)提出了一种基于M-估计的视频重构方法,解决视频信号在压缩采样过程中混入冲击噪声情况下的视频重构问题。本文引入Welsch M-估计作为衡量视频重构误差的代价函数,结合之前的背景模型,得到一种能有效削弱冲击噪声影响的压缩感知域视频重构与运动目标检测方法。实验结果表明,视频信号在压缩采样过程中混入引入不同信噪比或不同冲击强度的噪声时,新方法在重构性能上体现了很好的鲁棒性能。(3)设计实现了一个基于压缩感知域视频的运动目标检测软件仿真系统,进行多种监控场景下以及不同噪声影响下的视频重构与运动目标检测仿真实验。该系统能够完整地展示视频信号的压缩采样、重构与运动目标检测以及性能评价的所有流程。整个流程结束后,可以看到压缩感知域视频的重构和运动目标检测结果,以及针对这些结果的评价指标:峰值信噪比、结构相似度和综合评价指标。