论文部分内容阅读
随着当今社会的不断发展,各种治安事件和恐怖主义事件层出不穷,给社会管理工作带来了极大的挑战。为了达到安全防控的目的,快速应对突发事件,人们需要一种能够更加及时地获取信息和利用信息的方法。值得庆幸的是,随着计算机技术和网络技术的快速发展,构建大规模网络化的视频监控系统已经成为了可能,视频监控系统已经成为了一种现代城市所必需的新型基础设施。但是,随着监控数据量的爆炸性增长,传统的人工监控方式已经不能满足需求,必须推动研制新一代基于人工智能,可以对视频进行自动分析、识别和检索的智能视频监控系统,已经成为了安防界和科研界的共识。在诸多智能视频监控技术研究领域中,如何获取监控视频中与人体对应的前景并对其动作进行识别是一个重要的研究课题。但是,由于人体可以活动的自由度相当高,并且在外观和动作方面的个体差异性很大,对其进行精确高效的自动分析面临着许多困难。本文针对智能视频监控中的前景提取与动作识别问题,围绕三个关键子问题,即视频中运动前景的提取、运动前景的去模糊、人体动作识别,进行了研究,提出了相应的解决方法。本文的主要内容概括如下:首先,对智能视频监控中前景提取和动作识别问题进行了介绍,对一些基本概念和方法进行了归纳,然后围绕三个关键子问题进行展开,对传统方法、技术现状和发展趋势进行了综述,对容易混淆的术语做出了定义。其次,传统的背景建模方法没有考虑视频在时间和空间邻域内的信息冗余,从而造成了背景模型的过度臃肿。本文针对这种弊病,提出了基于视频块的背景建模技术,在块的层次上对背景进行了建模,大大降低了算法的空间复杂度;同时,方法简化了色彩编码本模型,降低了时间复杂度,使查找速度得到提升。再次,传统处理视频图像模糊方法针对的场景是相机抖动产生的模糊,不能适应视频监控等场景下因为物体运动所产生的模糊。为此,本文提出了一种针对视频中运动前景的模糊估计方法。该方法采用仿射运动模型来描述物体运动,利用KLT特征对物体运动的模型参数进行了估计,并依此得出了点传播函数。本文提出了一种新的蒙板估计方法,利用先前估计出的点传播函数对蒙板进行了细化,从而对前景进行精确的提取。与传统的蒙板提取方法相比,本文的方法不仅不需要手工交互,而且受噪声影响更小。另外,本文提出了一种基于迭代的理查德露西反卷积方法,可以利用空间变化的点传播函数对图像进行还原。最后,本文突破了人体动作识别的底层特征和分类模型的传统搭配模式,提出将局部特征和流形学习进行结合的总体框架。在这一新的框架下,采用时空兴趣点作为人体动作的局部特征描述符。同时在流形弹性网方法的基础上,提出了弹性流形嵌入方法,对多模式的数据首先聚类为子类,然后按照子类分别进行流形学习,避免了将相同动作类别中多模式的数据在投影过后混淆在一起。与传统的动作识别方法相比,本文提出的方法的识别正确率得到了很大的提高。