论文部分内容阅读
中图分类号:TP391.41 文献标识码:A 文章编号:1009-914X(2013)07-0254-01
一.引言
人类从外界获取的信息,有80%以上是通过视觉途径获得的。随着计算机信息技术的日趋成熟和相关硬件设备的广泛普及,特别是人工智能领域相关研究的不断深入,使得这样一种趋势日益鲜明,即使是人类视觉能够完成的任务,科学家和学者们都在努力试图让计算机去代劳,因此形成了一门新兴的科学——计算机视觉。计算机视觉的研究始于20世纪50年代,当时研究的主要目标是通过检测图像中的物体并获得这些物体间的关系来进行低层次图像理解。自20世纪70年代起,目标分割、边缘检测等问题的研究启发了学者们开始寻求解决初步视觉问题的有效方法。1982年,Mart提出了比较完善的计算机视觉理论,并提出了进行视觉理解需要将观测到的场景进行完全的几何重建的观点。由于受到该观点的影响,此后计算机视觉一直把定量地从图像中重构三维真实世界的空间信息作为主要的研究目标,但是,十多年来研究性的论文虽然成千上万,实际应用方面的进展却非常少,特别是热门的各种 “ShapefromX”算法,无一能用之于实际,人们开始认识到按照Marr的理论体系很难达到所提出的目标,于是很多专家学者再一次从目标、理论和方法上开始反思。1992年,斯坦福大学的Binford教授在杂志上发表的“计算机视觉的无知、短见和天真”一文,批评了该领域中存在的没有充分利用知识(无知)、没有充分考虑时空的约束(短视)及缺少实验分析和验证(天真)-个严重问题,继而引起了广泛深刻的学术讨论。一些著名的学者也纷纷给出了自己的看法,其中A.Rosenfeld与Y.Aloimonos就指出,Marr的定量重构三维世界这一目标提得太高是不必要的,应该发展有限目标、特定任务的专用视觉系统;T.Pavilidis也提出了类似的看法,主张采用分阶段子目标以求得计算机视觉不断地取得实质性进展。这些专家的权威性讨论对计算机视觉的发展方向、理论和方法都产生了重大的影响。近年来,在计算机视觉研究中,面向实用的理论和方法,例如主动视觉、主动测距、基于知识的视觉、多传感器融合等等得到了重视和发展,这说明了计算机视觉正在摆脱几十年来追求不现實、不必要的高目标的影响,逐步向实用有效的方向发展。在智能监控系统中,基于视频图像的运动目标检测和跟踪是系统中一个重要的组成部分,也是其中的核心技术。它处于整个视觉监控系统的底层,是各种后续处理的基础。在已有成果的基础上,对基于视频图像的运动目标检测和跟踪做了详细研究。首先在图像预处理方面,重点研究了图像对比度增强技术,采用一种基于拉普拉斯金字塔算法的多尺度对比度增强算法,提高了算法对光线较差的情况下的处理能力;其次在目标检测方面,对当前较为典型的几种运动目标检测方法进行比较分析,提出一种帧间差分法和背景差分法相结合的运动目标检测方法,并结合分块去噪的方法来检测目标;最后利用基于前两个时刻的轨迹拟合预测算法对检测出的运动目标进行跟踪。
运动检测技术是指在指定区域能识别图像的变化,检测运动物体的存在并避免由光线变化带来的干扰。但是如何从实时的序列图像中将变化区域从背景图像中提取出来,还要考虑运动区域的有效分割对于目标分类、跟踪等后期处理是非常重要的,因为以后的处理过程仅仅考虑图像中对应于运动区域的像素。然而,由于背景图像的动态变化,如天气、光照、影子及混乱干扰等的影响,使得运动检测技术成为一项相当困难的工作。而且对计算机视觉的其它研究领域有着重要的推动作用。
二.运动检测技术原理
(1)目前几种常用的方法:
①背景减除
背景减除方法是目前运动检测技术中最常用的一种方法,它是利用当前图像与背景图像的差分来检测出运动区域的一种技术。它一般能够提供最完全的特征数据,但对于动态场景的变化,如光照和外来无关事件的干扰等特别敏感。最简单的背景模型是时间平均图像,大部分的研究人员目前都致力于开发不同的背景模型,以及减少动态场景变化对于运动分割的影响。
②时间差分
时间差分方法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分并且阈值化来提取出图像中的运动区域。时间差分运动检测技术方法对于动态环境具有较强的能改变自己的习性以适应新的环境的一种特征,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产生空洞现象。
三.运动检测技术的实现
运动检测技术就是通过运动判别、运动区域提取和形态滤波 3个处理步骤。在一个运动图像帧序列中,把其中图像几乎无变化的连续几帧滤掉,仅剩下图像在有变化的帧序列, 把图像帧中的运动区域提取出来,利用二值形态学的开和闭对二值图像帧进行消除突刺和填充小孔处理。①运动判别使用差影法,将前后两帧图像进行相减,并对相减得到的结果帧进行检测,如果结果帧几乎为空帧,则认为这两帧图像无变化,并把无变化的帧删掉;否则会认为这两帧图像有变化,并把它们保存在结果队列中作为下一步运动区域提取的数据。 ②运动区域提取样本文采用一阶递归滤波器来实现背景图像的自适应生成。③形态滤波由此可以看出区域提取的结果包含一些噪声,为了避免错误的观测,必须将这些噪声滤除,从而使后续图像分析变得容易,通常可以采用基于数学形态学的滤波方法 。第一 个"闭"操作的目的就是防止人物中的一些小的细节被后续的 "开"操作所移去,最后一个"闭"操作的目的就是将人物区域中的一些小碎片合并(连接)成一个封闭的连通域。处理结果运动检测技术(移动侦测)技术评估。
要对运动检测技术的性能进行评估并不容易,特别是要进行定量的分析时,必须提供一个来作比较、研究的标准视频序列,它应该包括突然场景变化,摄像机移动以及光线明暗变换等特殊效果。检测方案可用多种参数来评估,比如检测成功率、检测失败率等等。在实际应用环境中,可以通过调节阀值对室内普通环境,室外环境获得比较好的监测效果。还可根据功能实现的方法分类,主要是对软件和硬件两大类实现方法进行一些定性的分析。
用软件实现的监测功能,如果用主机的CPU来完成数值计算,算法不能太复杂,而且计算量不宜太大,否则会影响监控系统其他功能(如显示、录像等)的实现。如果算法下载到DSP上运行,就可以解决这个问题,首先它的功能扩充非常容易,算法的优化不会造成不必要的浪费,可以生成新的微码下载到DSP上,就可以提升性能,并且可以根据用户不同的需求提供一些个性化的功能组合。
检测程序不断从管道中读取帧数据,从而运动检测技术程序可以 视频图像捕获一般有两种方法,一种是利用视频捕获卡对这些运动图像进行运动判别、运动区域提取、二值化及形状所附带的SDK开发工具,这种捕获方法的实现是与设备有关系、态滤波几个步骤处理,从而鲁棒地、实时地实现运动的检测,依赖于视频捕获卡与摄像头的类型,不利于灵活应用;检测输出结果为运动的目标。同时,它也可将数字视频捕获到文件中。在进行视频捕获之前需要创建一个捕获窗,所有的捕获操作及其设置都以它为基础实验结果表明所述的方法,对光照、背景内容的变化不敏感,这种方法已经较好地应用于我们生活的运动跟踪技术研究项目中。
四.结论
通过运动检测技术方法可以很好地检测出运动的区域,从而鲁棒地、实时地实现运动的检测,输出的检测结果为运动的目标。基于音频视频的运动检测技术以其直观明了,可以不难看出运动检测技术对计算机网络下视觉的其它研究领域有着重要的推动作用。
一.引言
人类从外界获取的信息,有80%以上是通过视觉途径获得的。随着计算机信息技术的日趋成熟和相关硬件设备的广泛普及,特别是人工智能领域相关研究的不断深入,使得这样一种趋势日益鲜明,即使是人类视觉能够完成的任务,科学家和学者们都在努力试图让计算机去代劳,因此形成了一门新兴的科学——计算机视觉。计算机视觉的研究始于20世纪50年代,当时研究的主要目标是通过检测图像中的物体并获得这些物体间的关系来进行低层次图像理解。自20世纪70年代起,目标分割、边缘检测等问题的研究启发了学者们开始寻求解决初步视觉问题的有效方法。1982年,Mart提出了比较完善的计算机视觉理论,并提出了进行视觉理解需要将观测到的场景进行完全的几何重建的观点。由于受到该观点的影响,此后计算机视觉一直把定量地从图像中重构三维真实世界的空间信息作为主要的研究目标,但是,十多年来研究性的论文虽然成千上万,实际应用方面的进展却非常少,特别是热门的各种 “ShapefromX”算法,无一能用之于实际,人们开始认识到按照Marr的理论体系很难达到所提出的目标,于是很多专家学者再一次从目标、理论和方法上开始反思。1992年,斯坦福大学的Binford教授在杂志上发表的“计算机视觉的无知、短见和天真”一文,批评了该领域中存在的没有充分利用知识(无知)、没有充分考虑时空的约束(短视)及缺少实验分析和验证(天真)-个严重问题,继而引起了广泛深刻的学术讨论。一些著名的学者也纷纷给出了自己的看法,其中A.Rosenfeld与Y.Aloimonos就指出,Marr的定量重构三维世界这一目标提得太高是不必要的,应该发展有限目标、特定任务的专用视觉系统;T.Pavilidis也提出了类似的看法,主张采用分阶段子目标以求得计算机视觉不断地取得实质性进展。这些专家的权威性讨论对计算机视觉的发展方向、理论和方法都产生了重大的影响。近年来,在计算机视觉研究中,面向实用的理论和方法,例如主动视觉、主动测距、基于知识的视觉、多传感器融合等等得到了重视和发展,这说明了计算机视觉正在摆脱几十年来追求不现實、不必要的高目标的影响,逐步向实用有效的方向发展。在智能监控系统中,基于视频图像的运动目标检测和跟踪是系统中一个重要的组成部分,也是其中的核心技术。它处于整个视觉监控系统的底层,是各种后续处理的基础。在已有成果的基础上,对基于视频图像的运动目标检测和跟踪做了详细研究。首先在图像预处理方面,重点研究了图像对比度增强技术,采用一种基于拉普拉斯金字塔算法的多尺度对比度增强算法,提高了算法对光线较差的情况下的处理能力;其次在目标检测方面,对当前较为典型的几种运动目标检测方法进行比较分析,提出一种帧间差分法和背景差分法相结合的运动目标检测方法,并结合分块去噪的方法来检测目标;最后利用基于前两个时刻的轨迹拟合预测算法对检测出的运动目标进行跟踪。
运动检测技术是指在指定区域能识别图像的变化,检测运动物体的存在并避免由光线变化带来的干扰。但是如何从实时的序列图像中将变化区域从背景图像中提取出来,还要考虑运动区域的有效分割对于目标分类、跟踪等后期处理是非常重要的,因为以后的处理过程仅仅考虑图像中对应于运动区域的像素。然而,由于背景图像的动态变化,如天气、光照、影子及混乱干扰等的影响,使得运动检测技术成为一项相当困难的工作。而且对计算机视觉的其它研究领域有着重要的推动作用。
二.运动检测技术原理
(1)目前几种常用的方法:
①背景减除
背景减除方法是目前运动检测技术中最常用的一种方法,它是利用当前图像与背景图像的差分来检测出运动区域的一种技术。它一般能够提供最完全的特征数据,但对于动态场景的变化,如光照和外来无关事件的干扰等特别敏感。最简单的背景模型是时间平均图像,大部分的研究人员目前都致力于开发不同的背景模型,以及减少动态场景变化对于运动分割的影响。
②时间差分
时间差分方法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分并且阈值化来提取出图像中的运动区域。时间差分运动检测技术方法对于动态环境具有较强的能改变自己的习性以适应新的环境的一种特征,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产生空洞现象。
三.运动检测技术的实现
运动检测技术就是通过运动判别、运动区域提取和形态滤波 3个处理步骤。在一个运动图像帧序列中,把其中图像几乎无变化的连续几帧滤掉,仅剩下图像在有变化的帧序列, 把图像帧中的运动区域提取出来,利用二值形态学的开和闭对二值图像帧进行消除突刺和填充小孔处理。①运动判别使用差影法,将前后两帧图像进行相减,并对相减得到的结果帧进行检测,如果结果帧几乎为空帧,则认为这两帧图像无变化,并把无变化的帧删掉;否则会认为这两帧图像有变化,并把它们保存在结果队列中作为下一步运动区域提取的数据。 ②运动区域提取样本文采用一阶递归滤波器来实现背景图像的自适应生成。③形态滤波由此可以看出区域提取的结果包含一些噪声,为了避免错误的观测,必须将这些噪声滤除,从而使后续图像分析变得容易,通常可以采用基于数学形态学的滤波方法 。第一 个"闭"操作的目的就是防止人物中的一些小的细节被后续的 "开"操作所移去,最后一个"闭"操作的目的就是将人物区域中的一些小碎片合并(连接)成一个封闭的连通域。处理结果运动检测技术(移动侦测)技术评估。
要对运动检测技术的性能进行评估并不容易,特别是要进行定量的分析时,必须提供一个来作比较、研究的标准视频序列,它应该包括突然场景变化,摄像机移动以及光线明暗变换等特殊效果。检测方案可用多种参数来评估,比如检测成功率、检测失败率等等。在实际应用环境中,可以通过调节阀值对室内普通环境,室外环境获得比较好的监测效果。还可根据功能实现的方法分类,主要是对软件和硬件两大类实现方法进行一些定性的分析。
用软件实现的监测功能,如果用主机的CPU来完成数值计算,算法不能太复杂,而且计算量不宜太大,否则会影响监控系统其他功能(如显示、录像等)的实现。如果算法下载到DSP上运行,就可以解决这个问题,首先它的功能扩充非常容易,算法的优化不会造成不必要的浪费,可以生成新的微码下载到DSP上,就可以提升性能,并且可以根据用户不同的需求提供一些个性化的功能组合。
检测程序不断从管道中读取帧数据,从而运动检测技术程序可以 视频图像捕获一般有两种方法,一种是利用视频捕获卡对这些运动图像进行运动判别、运动区域提取、二值化及形状所附带的SDK开发工具,这种捕获方法的实现是与设备有关系、态滤波几个步骤处理,从而鲁棒地、实时地实现运动的检测,依赖于视频捕获卡与摄像头的类型,不利于灵活应用;检测输出结果为运动的目标。同时,它也可将数字视频捕获到文件中。在进行视频捕获之前需要创建一个捕获窗,所有的捕获操作及其设置都以它为基础实验结果表明所述的方法,对光照、背景内容的变化不敏感,这种方法已经较好地应用于我们生活的运动跟踪技术研究项目中。
四.结论
通过运动检测技术方法可以很好地检测出运动的区域,从而鲁棒地、实时地实现运动的检测,输出的检测结果为运动的目标。基于音频视频的运动检测技术以其直观明了,可以不难看出运动检测技术对计算机网络下视觉的其它研究领域有着重要的推动作用。