论文部分内容阅读
视频中的人体动作识别是一个非常活跃的研究领域,随着相机、手机等电子产品行业的快速发展,对基于视频中人体动作识别的应用提出越来越高的要求。针对人体动作在视频中的定位问题,如何对视频中提取的多种特征进行有效融合的问题以及如何利用动作标签信息提高分类效果等问题,提出了利用流形度量学习的人体动作识别方法。首先根据人体区域利用基于人物肢体伸展程度分析的方法,获取人体区域的面积变化函数。由于面积变化函数随时间不断变化的过程中会产生相应的噪点,为了使得面积函数体现出本质的波动特征,在获取面积变化函数之后对面积函数使用稳健的局部加权平滑方法对面积函数进行平滑。取面积函数的极小值作为动作的切分点对动作进行切分,将后续的动作识别对象具体化。其次从每一段动作片段中分别提取人体区域的时域全局特征、空域特征、帧间光流特征以及帧内局部旋度特征和散度特征,将这些特征构造成为一种7×7的协方差矩阵描述子将多种特征进行融合,在黎曼流形中对动作进行描述。最后在训练阶段结合流形度量学习方法,根据训练样本的标签信息有监督地寻找一种在流形空间中更有效地度量方法,提高同类间的聚合度,加大不同类别之间的差异,从而达到提高动作分类的效果。在实验阶段,对weizmann公共视频库的切分实验统计结果表明本文提出的视频切分方法具有很好的切分能力,能够做好动作识别前的预处理;在weizmann公共视频数据集上进行了流形度量学习前后的识别效果对比,结果表明利用流形度量学习方法对动作识别效果提升2.8%;在weizmann和KTH两个公共视频数据集上的平均识别率分别为95.6%和92.3%,与现有方法的比较结果表明本文提出的动作识别方法有更好的识别效果。多次实验结果表明本文算法在预处理过程中动作切分效果理想,描述动作所构造协方差矩阵对动作的表达有良好的多特征融合能力,流形度量学习方法对动作识别的准确性有明显提高。