论文部分内容阅读
视觉注意是视觉系统一个重要的信息加工机制。该机制能选择性地分配资源给某些认知加工过程,减少大量冗余加工,使得这些认知过程对信息的加工更加快速准确。因此,模拟视觉注意机制的视频信息处理成为认知计算与计算机视觉领域的重要研究课题。视频对象检测对视频处理与分析具有重要作用,但视频场景变化的不确定性会加剧视频对象检测的难度,如光照变化,背景扰动,镜头移动等,使得视频对象检测一直是计算机视觉中的经典难题。然而,视觉注意能克服场景变化的不确定性,对运动对象维持着稳定有效的关注状态,因此模拟视觉注意的运动对象检测成为研究的热点。目前,基于视觉注意机制的视频对象检测大多采用传统的空间特征或运动特征加工方法完成,并未考虑视觉系统神经元的运动感知机理,无法克服传统算法对非刚性目标检测的诸多问题。针对这些不足,本文结合视觉系统生理学和心理学的研究成果,构建了基于视觉初级视皮层(V1)信息加工的视觉注意计算模型。该模型利用视觉皮层的背侧和腹侧双通路理论,充分整合不同通道的特征获取更加有效的注意显著性图,并应用于视频对象检测,取得了较好的检测效果。其主要创新点表现在以下几个方面: 首先,构建了基于视觉双通道理论的视觉注意计算模型。该模型模拟视网膜的机理获取对比度增强的时空信息;利用时空Gabor滤波器模拟V1神经元经典感受野的时空属性,提取方向性的和无方向性的运动能量;模拟 V1神经元的非经典感受野的中心环绕属性,获取方向性的和无方向性的时空信息;利用不同速度下感知信息的特点,融合时空信息,获取视频对象的显著性图。 其次,提出了基于神经元中心环绕作用的全局特征整合方法。利用视觉皮层神经网络中神经元侧连接所引起的中心环绕易化与环绕抑制作用,提出了环绕抑制和环绕易化的计算方法,给出了环绕易化与环绕抑制相互作用的动态平衡条件。从而抑制了无关干扰,整合了全局特征,从而实现对时空特征的全局感知。 最后,提出了融合不同特征的显著图计算方法和视频对象检测方法。利用感知的全局特征,结合不同特征的属性,计算显著性图。利用工作记忆保留的时空上下文信息,从时间上加强对象区域的有效标定,采用反馈计算的方法,获取完整的对象检测。 利用上述研究成果建立了视频对象检测系统,通过在Weizmann和KTH的人体动作视频集,以及PETS2000/2001,CAVIAR,OTCBVS_BENCH,ACCV2012监控视频集下测试,本文建议的模型能有效的检测刚性和非刚性的视频对象。通过与其它模型的性能对比,本文模型在对象的检测有效性和完整性皆有较强优势。