论文部分内容阅读
识别动作是视频信息处理中的关键技术之一,主要目的是获取视频序列中的运动特征,便于视频信息的应用。由于人体动作在在运动特性、视频记录条件、个体差异等方面的变化,使得动作识别成为当前计算机视觉领域里最具挑战性的识别问题之一。随着脑神经科学研究的不断深入,人类对自身视觉系统的了解越来越清晰,相应的研究成果对计算机视觉中识别问题的研究提供了很大的启发。因此,模拟人脑视觉系统构建动作识别模型,一方面能够加深对人类大脑视觉信息处理系统的理解,另一方面为计算机实现动作识别提供了新的方法。本文在总结分析了已有的仿生动作识别系统的基础下,根据生物视觉系统信息处理的层次结构模型展开研究,初步取得了以下几个方面的研究结果:构建了基于注意机制的人类动作识别系统。该系统针对已有的仿生动作识别系统计算量大、耗时长的问题,将视觉注意机制引入动作识别模型中,采用HMAX层次结构模型,实现了对运动目标的感知及准确的定位,获得了准确有效的特征模板,从而构建了基于视觉注意机制的层次结构动作识别系统。提出了基于时空显著性的选择注意模型。该模型针对已有的视觉注意模型无法较好的解决视频序列中的背景噪声问题,将从视频序列中获得的运动信息作为获取显著性区域的特征之一,融合空间信息和运动信息,达到准确地获取运动对象的显著性区域的目的,从而减少视频序列中背景噪声的影响,提高了动作识别系统分析视频信息的效率。提出了一种快速获取有效特征模板的方法。由于特征模板的选取直接关系到运动特征提取的优劣,最终影响了系统识别的准确性,因此,给出了基于时空显著性特征的有效特征模板获取方法。该方法在基于时空显著性的视觉注意模型获取的感兴趣区域基础上,通过分析视频序列的中间级特征,即复杂细胞的响应,建立复杂细胞响应的能量值与运动目标对应的关系,从而获取候选特征小块的位置,以便系统根据识别要求选取相应的特征小块。该方法能直接获得性能较好的特征小块,降低了系统提取动作特征所需的时间。利用Weizmann和KTH等人体动作视频数据库对本文提出的方法进行测试,实验结果表明,本文提出的方法既减少了识别计算量,加快了识别速度,又提高了动作的识别率。另外,通过不同数据库中动作识别的交叉验证,表明本文提出的方法具有较强的鲁棒性。