论文部分内容阅读
人体行为识别的研究是计算机视觉的一个重要研究领域,近年来受到了越来越多的学者的研究与关注。这主要是因为该方向在人类生活和科研等领域有着广泛的应用前景,比如视频监控、人机智能交互、互联网中视频的搜索、运动分析等。本文主要基于轨迹信息完成行为识别的过程,针对稠密特征点的检测方法,稠密轨迹的建立和行为模型的表示方法进行了深入研究,具体内容如下:(1)针对当前基于轨迹研究行为识别时图像中轨迹起始点数目较少的问题,借鉴稠密采样在图像分类应用中的成功案例,本文提出一种改进的稠密特征点的检测方法。首先对视频的当前帧建立多分辨率图像金字塔,然后分别对其利用稠密栅格进行采样,通过将栅格中图像的梯度矩阵的最大特征值与图像中所有栅格图像块的最小梯度特征值中的最大值进行比较来获得稠密特征点。实验结果表明与其它特征点的检测算法结果相比,本文算法在不同数据库中的多种环境下均能得到稠密特征点。(2)针对直接利用光流场进行中值滤波后得到的稠密轨迹中存在部分错误点的现象,本文在光流中值滤波的基础上,提出一种基于特征点主方向建立轨迹的方法,实现对特征点的筛选。通过比较跟踪前后特征点的主方向进一步判定跟踪的有效性,将符合条件的特征点作为轨迹的一部分,直到设定的轨迹长度时停止,并重新开始建立新的轨迹。当得到有效的轨迹后,利用轨迹周围的信息进行特征提取。首先以轨迹为中心建立一条包含图像数据的时空管道,并对管道进行时空域上的划分。由于分割后的管道较短,且管道特征以平均值形式表示,故获得的特征具有旋转不变性。实验表明基于特征点主方向验证建立的轨迹更加稳定可靠,由此获得的特征也具有更好的可分性。(3)针对行为的描述过程,本文采用一种新的模型表示方法:VLAD模型。实验表明与BOF模型相比该模型对高维特征的识别效果更好。上述工作通过建立更加稠密和稳定的光流轨迹特征,形成了一套完整的人体行为识别算法,在标准数据库Veizmann和KTH的测试中可以看到该方法能够有效提高识别结果,证明了本文改进算法的有效性。