基于稠密光流轨迹的人体行为识别研究

来源 :东北大学 | 被引量 : 4次 | 上传用户:wangliang284
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别的研究是计算机视觉的一个重要研究领域,近年来受到了越来越多的学者的研究与关注。这主要是因为该方向在人类生活和科研等领域有着广泛的应用前景,比如视频监控、人机智能交互、互联网中视频的搜索、运动分析等。本文主要基于轨迹信息完成行为识别的过程,针对稠密特征点的检测方法,稠密轨迹的建立和行为模型的表示方法进行了深入研究,具体内容如下:(1)针对当前基于轨迹研究行为识别时图像中轨迹起始点数目较少的问题,借鉴稠密采样在图像分类应用中的成功案例,本文提出一种改进的稠密特征点的检测方法。首先对视频的当前帧建立多分辨率图像金字塔,然后分别对其利用稠密栅格进行采样,通过将栅格中图像的梯度矩阵的最大特征值与图像中所有栅格图像块的最小梯度特征值中的最大值进行比较来获得稠密特征点。实验结果表明与其它特征点的检测算法结果相比,本文算法在不同数据库中的多种环境下均能得到稠密特征点。(2)针对直接利用光流场进行中值滤波后得到的稠密轨迹中存在部分错误点的现象,本文在光流中值滤波的基础上,提出一种基于特征点主方向建立轨迹的方法,实现对特征点的筛选。通过比较跟踪前后特征点的主方向进一步判定跟踪的有效性,将符合条件的特征点作为轨迹的一部分,直到设定的轨迹长度时停止,并重新开始建立新的轨迹。当得到有效的轨迹后,利用轨迹周围的信息进行特征提取。首先以轨迹为中心建立一条包含图像数据的时空管道,并对管道进行时空域上的划分。由于分割后的管道较短,且管道特征以平均值形式表示,故获得的特征具有旋转不变性。实验表明基于特征点主方向验证建立的轨迹更加稳定可靠,由此获得的特征也具有更好的可分性。(3)针对行为的描述过程,本文采用一种新的模型表示方法:VLAD模型。实验表明与BOF模型相比该模型对高维特征的识别效果更好。上述工作通过建立更加稠密和稳定的光流轨迹特征,形成了一套完整的人体行为识别算法,在标准数据库Veizmann和KTH的测试中可以看到该方法能够有效提高识别结果,证明了本文改进算法的有效性。
其他文献
为解决高温、强浸蚀介质、强热震性等恶劣条件下的温度测量难题,目前较普遍采用的方法是在感温元件上外加一层、甚至两层保护套管,致使实测温度总是滞后于被测温度的变化,产生动
电磁逆散射是利用未知物体的电磁散射信号重建物体形状和结构的一类问题,广泛存在于生物医学工程、无损检测、地球物理、模式识别等诸多应用领域。由于该未知物体的特性参数与
移动机器人的定位与导航是移动机器人领域的关键技术,定位问题是机器人真正自主化和智能化研究中最为重要的一个基本问题。基于传感器的定位是当前移动机器人领域非常活跃的研
学位
无轴承电机以其无摩擦、无磨损、无需润滑和密封等一系列优良特性,在能源交通、航空航天及机器人等高科技领域具有广阔的应用前景。与磁轴承支承的电机相比,无轴承电机具有一些独特的优点,1)径向力绕组叠压到电机的定子绕组上,不占用额外的轴向空间,电机轴向长度可以设计的较短,临界转速可以非常高;与磁轴承电机相比,在转轴长度一定的情况下,电机的输出功率得到大幅度的提高。2)电机的结构更趋简单,维修方便,特别是电
目前,康复机器人已经成为国际机器人领域的一个研究热点。由于战争、疾病、工伤、交通事故及意外伤害等原因,致使数以百万的人失去下肢,人们迫切希望通过假肢恢复截肢者的行走功
本论文的工作以一个基于大语料库的英文文语转换(TTS)系统的开发为背景,针对英文TTS系统中的韵律生成及字音转换中的一些关键问题展开研究,其中字音转换更是本文研究的重点。主
学位
随着计算机技术,控制理论,图像处理技术及网络技术的发展,工业控制得到了迅速发展。特别是将以太网与现场总线结合,能真正实现工业生产过程的监测、控制、管理与决策于一体的
汽车电子系统日益复杂,连接并控制各个电子单元的车载网络已成为汽车电子领域的研究热点。CAN/LIN网络作为提高控制单元间通讯可靠性和降低导线成本的网络总线技术成为了车载
酒吧问题及少数者博弈(MG)是各种实际拥塞和协调问题的简化模型,它们描述了网络、交通、经济、生态以及其它领域中,面对有限资源独立的参与者之间的相互竞争行为.对这类拥塞