论文部分内容阅读
作为计算机视觉领域中重要的课题之一,视频中的人体行为识别得到了越来越多的关注。这一技术与人类的社会生活密切相关,其应用范围已经涵盖智能视频监控、人机交互、运动分析、虚拟现实、视频检索、医疗辅助等诸多领域,随着相关技术的成熟,应用前景越加明朗。近年来,人体行为识别技术的研究已经取得了一些成果,虽然有些成果能够在一些现有数据集上对行为进行较好的识别,但是并不能避免光照、抖动、背景杂乱、遮挡等噪声的干扰,使得目前的研究成果仍然难以在实际生产生活中使用。同模式识别过程,人体行为识别包括三个主要的步骤:视频中人体行为表示、人体行为模型学习和对行为进行判别,其中的重点是行为的表示,能否从原始的视频数据中提取得到对行为具有高判别性和鲁棒性的特征向量,严重地影响了行为的识别结果。现有的研究方法多是针对视频中不同行为空域特性的研究,针对时域特性的研究较少,在本文中,我们主要研究了不同行为在时域上的特性差异,旨在提取不同行为随时间演变的时域判别特征,实现人体行为的有效识别。本文的主要工作如下:1.提出了一种基于正反时序特征学习的人体行为识别方法。该方法的提出基于这样一个朴素的假设:行为视频在正向和反向播放的时候具有差异,相似的行为对应的正反向差异也具有相似性,不同的行为正反向之间的差异不同。该方法首先从视频中提取空域局部特征,然后从空域局部特征中学习行为正向和反向的时序特征,最后将正向和反向时序特征看做是两个类别,通过分类器提取正向和反向时序特征之间的差异,并将其作为视频的特征表示实现了行为的快速有效识别。2.提出了一种基于时序回归特征学习的人体行为识别方法。行为是原子动作在时间维上的有序排列,这种排列在时间维上往往具有连续性。该方法仔细地研究了行为的时序特性,提出了一种从正向视频序列中学习行为随时间演化的时域特征提取方法。首先对行为进行时序演化特性学习,然后对学习得到的时序演化特征进行回归,用回归系数作为行为的时序特性表示进行识别。3.提出了一种基于行为主框架特征学习的人体行为识别方法。视频在采集的过程中容易受多种噪声的干扰,这种干扰也随着对视频中行为的特征编码存在于能够表征行为的特征向量中。针对特征向量中存在的噪声干扰,提出了一种从时序特征中学习行为主框架特征的方法,通过在时域和频域构建金字塔实现行为低频主框架特征的提取,实现了更鲁棒的行为判别性表示。和上一个工作中提出的时序特征相比,该工作得到的行为特征判别性更强,同时特征维度大幅降低,提高了行为的识别速度。