论文部分内容阅读
随着经济水平的提升和人们公共安全意识的不断增强,视频监控遍布社会的各个角落,发挥着越来越重要的作用。当前人工值守的方式由于人类自身生理功能的缺陷,漏报率高、只能事后处理以及日益增长的人力成本,越来越不能满足飞速增长的监控需求。因此,如何利用计算机来自动的分析处理监控视频,提取所需的关键信息,成为当前计算机视觉和模式识别领域的研究热点,具有不可估量的研究价值和市场前景。本文关注于智能视频分析中最为关键的技术:目标检测、分类和跟踪,完成的主要工作如下:1.对视频监控的发展历程和存在的问题进行了简要介绍,指出了当前视频监控“看得清”但“看不懂”的现状,由此引出了智能视频分析的必要性,并给出了它的研究现状、处理流程和需要解决的关键问题。2.在基于运动的目标检测方面,详细的分析了帧差法、光流法、混合高斯模型以及近年来新出现的视觉背景提取、基于像素的分割等方法,针对基于像素的分割方法采用固定距离阈值更新导致的吸收前景的问题,提出了背景动态性相关的阈值更新方法,在国际通用的运动检测数据集上的测试表明其能有效抑制这种现象的发生。3.在目标分类方面,对基于哈尔特征的人脸检测算法、基于灰度直方图和支持向量机的行人检测算法、可变形组件模型和深度学习的目标检测算法进行了简要的阐述,鉴于深度学习近年来在图片分类中的卓越表现,我们使用卷积神经网络对背景建模检测到的前景进行分类,并构造了自己的数据集进行测试,结果表明深度学习在监控目标分类上能够获得非常不错的效果。4.为了建立前后帧的目标对应关系,还需要对提取到的目标进行跟踪。在简要介绍了短时单目标跟踪的研究现状和MOSSE、KCF、DSST等基于相关滤波跟踪方法的基础上,针对当前方法没有考虑摄像机运动而使用固定搜索窗口导致跟丢的问题,提出了一种自适应搜索窗口的多尺度相关滤波跟踪算法,在基准库上的测试表明本文提出的算法能够应对摄像机存在运动的场景。5.最后,以前述技术为基础,设计和实现了基于视频的车流统计系统。我们在多种场景下的进行了大量的测试,结果表明它能够应适应复杂的环境,达到很高的准确率,基本具备了商业化的前提。