论文部分内容阅读
动作识别是计算机视觉领域中极具挑战的识别任务之一,它已经广泛地应用于智能监控、人机交互等方面。近年来,随着脑神经科学研究的逐步深入,脑启发式人体动作识别取得了巨大的进步。 目前为止,研究人员根据人类视觉感知系统信息处理机制,提出了大量的仿生动作识别模型。但是这些模型均存在结构复杂、效率低等缺点。因此,本文在认真分析现有的仿生动作识别模型基础上,同时考虑到神经科学的研究成果,提出了一种简单的人体动作识别方法来模拟初级视觉皮层细胞的信息处理模式。并且利用VC++6.0集成开发环境中的MFC应用程序框架,实现模拟初级视觉皮层动作识别的系统。该系统解决的关键技术主要体现在了以下几个方面: 首先,利用层次化的方法设计整个系统。本系统包括测试、识别、分类三大功能模块。其中测试模块为了显示算法过程中各个中间结果;识别模块用于计算并保存每个输入视频图像的特征矢量;分类模块则是计算并显示最终的识别结果。 其次,为了实现三大模块的功能,本系统采用3DGabor时空滤波器及其非线性组合,建立简单和复杂细胞的模型,以此对视频图像进行处理,获取运动能量,并且利用环绕抑制的作用来降低噪声,实现时空信息感知;采用I&F脉冲神经元模型和均匀的神经元排列方式构建出脉冲形成层;根据脉冲链的平均发放率提取表示动作特征的特征矢量;采用分类器将获取的特征矢量进行分类识别。 最后,实现了三维卷积。本系统在模拟简单细胞的响应属性时,需要将三维Gabor时空滤波器与视频图像卷积,并且在模拟细胞的中心环绕属性时,也是利用复杂细胞的响应,即运动能量与环绕抑制权重函数卷积,实现运动信息在空间上的整合,获取信噪比高的运动信息。三维卷积实现了三维时空滤波器与视频图像直接卷积,与二维卷积相比,完成了运动对象的时空信息获取。