论文部分内容阅读
利用计算机视觉技术识别并理解人体的动作和行为是一个在人机交互和视频监控领域具有广泛应用前景的研究课题。利用计算机进行人体动作识别不仅可以大大减轻传统人工识别的工作量,而且随着计算机识别效率和精确度的提升所带来的经济效应和社会效应也将日益增加。目前,计算机人体动作识别技术可应用的场合有:视频分类、监控视频分析、体育视频处理以及智能家居开发等等。
关于计算机人体动作识别的研究在国内外已经开展多年,目前主要的研究方法大致可以分为以下几个方面:基于目标跟踪的方法、基于光流的方法、基于形状模板匹配的方法和基于时空关键点分析的方法。基于目标跟踪和形状模板匹配的方法在提取人体动作的全局特征之前首先要得到人体的轮廓或者人体动作的形状模板,而轮廓提取过程和人体动作形状模板构造过程容易受到噪声和背景变化的干扰,系统鲁棒性相对较差。基于光流的方法利用像素间的光流信息进行人体动作识别,但这类方法容易受到噪声以及光照强度变化的干扰。基于时空关键点分析的方法通过滤波、系数变换等数学方法,求出视频滤波响应或者系数变换的极值点,并将极值点所处位置表示为人体动作的时空关键点位置,从时空关键点中提取人体动作的时空运动特征作为识别的依据。这类方法对于低分辨率视频,以及噪声和摄像头运动造成的干扰也具有一定的鲁棒性。当然,选择不同的时空关键点检测算法以及提取不同的时空关键点特征对人体动作识别的效果也是不同的。
计算复杂度较高、识别精确度不高以及系统鲁棒性不够等问题仍存在于目前的计算机人体动作识别方法当中。如何在已有的研究基础上提高人体动作识别的精确度和效率而不付出太大的计算代价成为当前计算机人体动作识别的主要研究方向。本文在前人的研究基础上,采用结合人体动作时空关键点和三维SIFT局部描述子特征进行人体动作识别。本文提取这两类特征进行人体动作识别,主要是考虑时空关键点对人体动作时空运动信息的把握以及三维SIFT局部描述子对人体尺度和旋转的不变的特性。基于人体动作时空关键点的特征提取方法使用二维Gabor滤波器对相邻视频帧差进行人体动作关键点检测,再通过累积多帧的人体动作关键点形成包含更丰富人体动作信息的人体动作时空关键点云,并从人体动作时空关键点云中提取人体动作的时空特征信息。结合三维SIFT局部描述子的特征提取方法通过计算SIFT特征点和它邻域的梯度大小和方向,利用统计梯度方向直方图的方法得到视频的三维SIFT局部描述子,并提取出三维SIFT局部描述子特征进行人体动作识别。实验结果表示,本文采用的结合人体动作时空关键点和三维SIFT局部描述子特征的人体动作识别方法有较好的识别效果。