论文部分内容阅读
摘 要:电力系统中智能视频监控的应用尤为重要,而运动目标检测技术是智能视频监控系统的基础。对运动目标检测方法中的背景建模法、运动目标跟踪技术、图像序列的语意理解、运动目标的行为分析等进行了分析。
关键词:电力系统;视频监控;运动目标检测
1.引言
在电力系统中,智能视频监控用于对变电站设备、工作人员及周围环境的监控等,为变电站工作安全保障起到关键作用,特别是无人值守变电站的应用,确保其调控运行更为安全、可靠。
运动目标检测技术是智能化视频分析的基础,它的目的就是从动态图像序列中找到那些可能包含运动物体的感兴趣区域以供后续模块的进一步处理。常用的方法包括帧差法、背景差分法、光流法等。
帧差法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分并阈值化来提取图像中的运动区域。帧差法对动态环境适应性强,但一般情况下不能得到完整的运动目标,需要较多的后处理工作。背景差分法是利用当前图像帧与背景图像帧的差分来检测运动区域。背景差分法可以得到完整的运动目标,但对光线和其他外部的动态场景变化非常敏感,需要对背景作不断更新。光流法采用了运动目标随时间变化的光流特性来检测运动目标。光流法即使在摄像头运动时也能有效地检测运动目标,但计算复杂,不适用于实时性要求高的监控场合。
2.高斯混合背景建模算法
建立背景模型是背景减除法的重要步骤。采用高斯混合模型进行背景建模,这种模型能够根据样本值(像素点的颜色值)进入模型的不同频率,以及和模型中各个分布成功匹配的不同频率,来不断更新模型中所有高斯分布的参数,即对各个高斯分布的权重、均值和协方差等参数进行训练,使背景像素值分布收敛于一个或某几个高斯分布,实现背景像素值的聚类,从而实现对背景的建模。图像中每个像素点的混合高斯模型可以表示为:
的高斯分量的概率密度函数。
高斯混合背景建模算法根据当前像素值与模型中的 K 个高斯分布的匹配情况,对模型进行更新。如果像素值在某高斯分布均值的 2.5 倍方差范围之内,称之为成功匹配上该分布。如果当前像素值与K 个高斯分布都不匹配,则用一个新的高斯分布取代权重值最小的那个分布,新的分布的均值即为当前的像素值,同时为它分配一个较大的初始协方差和一个较小的初始权重值。
3.运动目标跟踪技术
运动目标检测常用的是利用图像序列的帧内信息和帧间信息,从而提取动态信息,这里采用背景差帧法检测运动目标。它的基本思路是将背景建模后的图像与新输入的图像做比较,通过判断像素点的灰度值变化、直方图的统计信息变化等来分割动态目标。
不难看出背景差帧法简单易于实现,并且能提供比较完全的数据,适用于背景好提取或者比较简单的情况。当出现光照、遮挡、雨雪雾、树枝摇摆、水面波动、机器抖动等变化时,背景模型需要进行及时更新变化。
运动目标在视频帧序列中会呈现一定规律的变化,主要取决于目标的运动速度以及视频的帧率。通过连续多帧图像的运动目标检测结果,可以对运动目标在图像空间的运动速度进行估算,结合图像的采集帧率,可以预测出运动目标在下一帧图像中出现的大致范围,从而实现对运动目标的视觉跟踪。
4.图像序列的语义理解
所谓图像序列的语义理解,就是通过对监控场景中的目标物行为的分析理解,给出相应的事件与行为描述。在动态图像的语义理解中,如何对行为建立好的模型从而进行行为的识别并与语义相联系是其中最为关键的内容。目前已经存在的行为建模方法有:模版匹配方法、框架模型、状态空间模型、神经网络模型和语义化的推理模型等。
基于模版匹配的方法,首先把一个图像序列转化成为一个静态的形状模型,然后,通过与预先存储的行为原型的比较进行识别。它的优点在于计算复杂度低且简单易行,但是,它对噪声和运动的时间间隔内的变化比较敏感。框架模型在动态图像语义化理解中经常用来对运动进行建模,采用事例框架来对行为建模。这种方法比较适合对静态图像进行解释,对比较复杂的动态场景中发生的运动来建立该模型不太合适。状态空间方法把每一种静态姿势定义为一个状态,状态空间的交互关联用一定的概率来表示。任意运动序列都通过状态表示的不同姿势间的某种组合来实现。组合概率的最大值作为行为分类的标准。神经网络具有非线性映射的能力,可以采用神经网络来实现从几何化的描述到语义概念之间的映射。神经网络具有学习能力,使得它能够通过学习得到行为模型,但是神经网络无法合理利用已知的知识。语义化的推理网络是一种常用的知识表达结构,同时也是一种推理结构,被广泛地用于动态图像序列的语义理解。
5.运动目标的行为分析
在电网环境下,监控的目标主要是人。人的行为分析是指对人的运动模式进行分析和识别,并用自然语言等加以描述,包括行为的表述、检测和识别。对于人运动的视觉分析系统而言,一般可分为三个处理层次:
(1)运动检测与目标分类:从图像序列中把变化的运动区域从背景中提取出来,并将检测到的不同的运动区域分成不同的运动目标。运动检测与目标分类是视觉监控系统的底层处理部分,是各种后续处理的基础。
(2)定位与跟踪:定位是指确定图像序列中运动目标的图像位置,进而确定其空间位置和姿态;跟踪是指在图像序列中创建基于位置、速度、形状、纹理、色彩等有关特征的对应匹配的过程。
(3)行为分析与理解:在上述两步的基础上,进一步研究图像序列中各个运动目标的性质和它们之间的相互关系,对运动模式进行分析和识别,最终得出对图像内容含义的理解以及对客观场景的解释。
6.总结
智能视频监控中运动目标检测涉及到计算机视觉、图像处理和视频分析等方法,在电力系统中有着重要的应用意义和应用价值。目前,该方向的研究已有很多,但是在实践中运动目标多样性及其场景的复杂性使得目标检测变得较为困难,有很多问题有待解决。
参考文献
[1]侯宏录,李宁鸟,刘迪迪等. 智能视频监控中运动目标检测的研究[J]. 计算机技术与发展,2012,22(2):49-52.
[2]郭玲. 智能视频监控中运动目标检测的算法研究[D]. 华南理工大学,2013.
[3]柯天兵,李永倩. 电力系统视频监控中目标检测与跟踪算法研究[J]. 2014,30(1):42-46.
[4]高凯亮,覃团发,王逸之等. 一种基于帧差法与背景减法的运动目标检测新方法[J]. 电讯技术,2011,51(10):86-91.
[5]李文斌,周晓敏,王长松. 一种基于背景减法的运动目标检测算法[J]. 北京科技大学学报,2008,30(2):212-216.
[6]李劲菊,朱青,王耀南. 一种复杂背景下运动目标检测与跟踪方法[J]. 仪器仪表学报,2010,31(10):2242-2247.
关键词:电力系统;视频监控;运动目标检测
1.引言
在电力系统中,智能视频监控用于对变电站设备、工作人员及周围环境的监控等,为变电站工作安全保障起到关键作用,特别是无人值守变电站的应用,确保其调控运行更为安全、可靠。
运动目标检测技术是智能化视频分析的基础,它的目的就是从动态图像序列中找到那些可能包含运动物体的感兴趣区域以供后续模块的进一步处理。常用的方法包括帧差法、背景差分法、光流法等。
帧差法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分并阈值化来提取图像中的运动区域。帧差法对动态环境适应性强,但一般情况下不能得到完整的运动目标,需要较多的后处理工作。背景差分法是利用当前图像帧与背景图像帧的差分来检测运动区域。背景差分法可以得到完整的运动目标,但对光线和其他外部的动态场景变化非常敏感,需要对背景作不断更新。光流法采用了运动目标随时间变化的光流特性来检测运动目标。光流法即使在摄像头运动时也能有效地检测运动目标,但计算复杂,不适用于实时性要求高的监控场合。
2.高斯混合背景建模算法
建立背景模型是背景减除法的重要步骤。采用高斯混合模型进行背景建模,这种模型能够根据样本值(像素点的颜色值)进入模型的不同频率,以及和模型中各个分布成功匹配的不同频率,来不断更新模型中所有高斯分布的参数,即对各个高斯分布的权重、均值和协方差等参数进行训练,使背景像素值分布收敛于一个或某几个高斯分布,实现背景像素值的聚类,从而实现对背景的建模。图像中每个像素点的混合高斯模型可以表示为:
的高斯分量的概率密度函数。
高斯混合背景建模算法根据当前像素值与模型中的 K 个高斯分布的匹配情况,对模型进行更新。如果像素值在某高斯分布均值的 2.5 倍方差范围之内,称之为成功匹配上该分布。如果当前像素值与K 个高斯分布都不匹配,则用一个新的高斯分布取代权重值最小的那个分布,新的分布的均值即为当前的像素值,同时为它分配一个较大的初始协方差和一个较小的初始权重值。
3.运动目标跟踪技术
运动目标检测常用的是利用图像序列的帧内信息和帧间信息,从而提取动态信息,这里采用背景差帧法检测运动目标。它的基本思路是将背景建模后的图像与新输入的图像做比较,通过判断像素点的灰度值变化、直方图的统计信息变化等来分割动态目标。
不难看出背景差帧法简单易于实现,并且能提供比较完全的数据,适用于背景好提取或者比较简单的情况。当出现光照、遮挡、雨雪雾、树枝摇摆、水面波动、机器抖动等变化时,背景模型需要进行及时更新变化。
运动目标在视频帧序列中会呈现一定规律的变化,主要取决于目标的运动速度以及视频的帧率。通过连续多帧图像的运动目标检测结果,可以对运动目标在图像空间的运动速度进行估算,结合图像的采集帧率,可以预测出运动目标在下一帧图像中出现的大致范围,从而实现对运动目标的视觉跟踪。
4.图像序列的语义理解
所谓图像序列的语义理解,就是通过对监控场景中的目标物行为的分析理解,给出相应的事件与行为描述。在动态图像的语义理解中,如何对行为建立好的模型从而进行行为的识别并与语义相联系是其中最为关键的内容。目前已经存在的行为建模方法有:模版匹配方法、框架模型、状态空间模型、神经网络模型和语义化的推理模型等。
基于模版匹配的方法,首先把一个图像序列转化成为一个静态的形状模型,然后,通过与预先存储的行为原型的比较进行识别。它的优点在于计算复杂度低且简单易行,但是,它对噪声和运动的时间间隔内的变化比较敏感。框架模型在动态图像语义化理解中经常用来对运动进行建模,采用事例框架来对行为建模。这种方法比较适合对静态图像进行解释,对比较复杂的动态场景中发生的运动来建立该模型不太合适。状态空间方法把每一种静态姿势定义为一个状态,状态空间的交互关联用一定的概率来表示。任意运动序列都通过状态表示的不同姿势间的某种组合来实现。组合概率的最大值作为行为分类的标准。神经网络具有非线性映射的能力,可以采用神经网络来实现从几何化的描述到语义概念之间的映射。神经网络具有学习能力,使得它能够通过学习得到行为模型,但是神经网络无法合理利用已知的知识。语义化的推理网络是一种常用的知识表达结构,同时也是一种推理结构,被广泛地用于动态图像序列的语义理解。
5.运动目标的行为分析
在电网环境下,监控的目标主要是人。人的行为分析是指对人的运动模式进行分析和识别,并用自然语言等加以描述,包括行为的表述、检测和识别。对于人运动的视觉分析系统而言,一般可分为三个处理层次:
(1)运动检测与目标分类:从图像序列中把变化的运动区域从背景中提取出来,并将检测到的不同的运动区域分成不同的运动目标。运动检测与目标分类是视觉监控系统的底层处理部分,是各种后续处理的基础。
(2)定位与跟踪:定位是指确定图像序列中运动目标的图像位置,进而确定其空间位置和姿态;跟踪是指在图像序列中创建基于位置、速度、形状、纹理、色彩等有关特征的对应匹配的过程。
(3)行为分析与理解:在上述两步的基础上,进一步研究图像序列中各个运动目标的性质和它们之间的相互关系,对运动模式进行分析和识别,最终得出对图像内容含义的理解以及对客观场景的解释。
6.总结
智能视频监控中运动目标检测涉及到计算机视觉、图像处理和视频分析等方法,在电力系统中有着重要的应用意义和应用价值。目前,该方向的研究已有很多,但是在实践中运动目标多样性及其场景的复杂性使得目标检测变得较为困难,有很多问题有待解决。
参考文献
[1]侯宏录,李宁鸟,刘迪迪等. 智能视频监控中运动目标检测的研究[J]. 计算机技术与发展,2012,22(2):49-52.
[2]郭玲. 智能视频监控中运动目标检测的算法研究[D]. 华南理工大学,2013.
[3]柯天兵,李永倩. 电力系统视频监控中目标检测与跟踪算法研究[J]. 2014,30(1):42-46.
[4]高凯亮,覃团发,王逸之等. 一种基于帧差法与背景减法的运动目标检测新方法[J]. 电讯技术,2011,51(10):86-91.
[5]李文斌,周晓敏,王长松. 一种基于背景减法的运动目标检测算法[J]. 北京科技大学学报,2008,30(2):212-216.
[6]李劲菊,朱青,王耀南. 一种复杂背景下运动目标检测与跟踪方法[J]. 仪器仪表学报,2010,31(10):2242-2247.