论文部分内容阅读
人体行为识别是计算机视觉领域一个备受瞩目的研究课题,许多专家学者对此进行了大量的研究。因深度图像不受光照变化等因素的影响,一些基于深度数据进行人体行为识别的方法相继被提出。如何对动作视频序列进行全面有效地表示是动作识别的研究重点,针对该问题本文对现有动作表示方法进行改进,提出了以下两种人体行为识别算法,具体内容如下:为了获得不同视角下的动作信息,提出了多视角深度运动图(多视角DMM)的人体行为识别算法。首先将一个动作样本的深度图像序列生成运动历史点云(MHPC),利用旋转矩阵将MHPC绕Y轴旋转一定角度。将MHPC和旋转后的MHPC投影到笛卡尔坐标平面上,投影后的点云分布更加稠密,由重叠点的空间坐标计算多视角DMM。然后利用方向梯度直方图(HOG)对多视角DMM进行特征提取,最后采用支持向量机(SVM)完成分类识别。多视角DMM增加了更多视角下的动作信息,但是动作执行过程中的时间信息利用不充分。为了解决这个问题,提出了时空能量图的人体行为识别算法。首先将一个动作样本的深度图像序列生成MHPC并将其旋转,然后将MHPC和旋转后的MHPC投影到笛卡尔坐标平面上,由重叠点的空间坐标和时间坐标生成时空能量图。相比于多视角DMM,三通道的时空能量图不仅包含更多视角下的动作信息,而且完整的捕获了动作的时间能量分布和空间能量分布。时空能量图的特征提取部分与多视角DMM类似,但在分类部分做了改进,分类器由SVM换成了性能更好的基于核的极限学习机(KELM)。将以上两种人体行为识别算法在公共数据库与自建数据库上分别进行实验,结果表明多视角DMM与时空能量图均能有效地提高动作识别的精度。时空能量图相比于多视角DMM识别效果更优,说明同时包含时间信息与空间信息的时空能量图能够更加全面高效地表示动作样本。