论文部分内容阅读
近年来,国内外研究者在行为识别领域经过不断深入研究,取得了颇为显著的成果。人体行为识别正逐渐演变成如图像处理分析、人机交互、视频检索以及智能监控等领域的基础保障,已发展成为计算机视觉分析领域的研究热点。然而,如何在复杂背景和摄像机运动等情况下提取具有丰富空间信息的特征从而提高识别效果是目前行为识别领域亟待解决的问题,本文对已有的研究成果进行细致地分析和总结,构建了两种用于行为识别的特征,主要工作如下:1.构建了两种基于时空梯度自相关的运动特征。针对现有行为识别方法提取到的特征对摄像头运动和复杂背景引起的噪点较敏感,以及无法充分利用空间信息等问题,本文在现有特征点优化方法的基础上引入曲率信息,构建了时空梯度自相关特征(3D Feature Auto-Correlation of Gradient,3DFACOG)和光流时空梯度自相关特征(3D Feature Auto-Correlation of Optical Flow Gradient,3DFACOFG),有效地克服了摄像机运动和复杂背景的干扰,同时在特征中引入了丰富的运动和空间信息,并且具有时空不变性。为了消除不同视频间存在的灰度变化以及光照等因素的影响,本文对提取到的特征进行归一化操作,使特征对旋转、光照不敏感且增强了特征的运动描述力。2.采用PCA对特征降维并改进了词袋模型。首先,针对视频特征维数高冗余信息多的问题,本文采用主成分分析法(Principal Component Analysis,PCA)对特征降维。其次,本文对词袋模型(Bag of Words,BOW)进行了改进,传统的BOW在直方图描述子构建过程中,对每一维特征只选择一个最近距离的标号,因此偏差较大。本文直方图描述子构建方法对每一维特征选取三个距离最近且含有权重信息的标号,在一定程度上减少了这一偏差。本文先利用支持向量机(Support Vector Machine,SVM)对3DFACOG、3DFACOFG以及串联融合特征分别进行训练测试,然后对3DFACOG、3DFACOFG以及串联融合特征的分类结果进行了决策级融合。为了验证本文构建的两个运动特征以及行为识别方法的有效性,分别在四个数据库上进行实验并与已有研究成果进行了对比分析。从实验结果可以看出本文行为识别方法中构建的3DFACOG、3DFACOFG两类特征对运动的描述力增强,同时本文行为识别方法充分利用了两个特征的互补信息,提高了行为识别准确率。