基于深度图像序列的人体动作识别方法研究

来源 :中国科学院大学 | 被引量 : 3次 | 上传用户:ti110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人体动作识别逐步成为计算机视觉领域研究的热点,并得到大量研究人员的关注。消费级深度相机的诞生,减轻了传统可见光图像的目标检测与分割任务的难度,并在人体姿态估计和动作识别方面表现出极好的性能优势,为人体动作识别方面提供了新的研究思路。本文针对基于深度图像序列的人体动作识别这一研究课题,从底层特征提取、中层特征编码、时空特征表示、深度网络特征学习四个层面展开了一系列研究工作。本文的主要贡献包括:(1)提出了一种基于骨架嵌入深度图像的人体动作识别方法该方法通过骨架关节点位置嵌入深度图像序列中,将人体划分为不同的运动部位,并构建局部时空模型得到具有紧凑形式的底层特征向量集合;然后结合所提出的简化的Fisher向量方法,对时序上不等长片段的底层特征进行中层特征编码,生成具有一致形式的特征向量表达。实验结果表明,该方法具有较高的实时性,可以应对复杂场景下的实时人体动作识别需求。(2)提出了一种基于时空立方金字塔的人体动作识别方法该方法采用时空立方金字塔模型对三视图投影的深度运动序列的时空结构进行划分,结合提出的立方体编码策略,生成具备较强时空描述能力的特征向量。实验结果表明,该方法在相对简单场景的场景下可以获得较好的识别性能。(3)提出了一种基于空间Laplacian和时间能量金字塔表示的人体动作识别方法该方法利用空间Laplacian和时间能量金字塔将深度图像序列表示为分布在不同时空位置上的高频和低频成分,然后分别提取高频成分和低频成分的底层特征向量,并将两种特征组合进行动作类型的判别。实验结果表明,该方法可以有效描述空间表观信息和时间运动信息,并较其他方法在识别性能和计算效率方面具有明显优势。(4)提出了一种基于残差网络双流信息融合的人体动作识别方法该方法以原始深度数据作为表观流、原始深度数据提取的梯度方向向量作为运动流,采用伪三维残差网络进行双流的早期特征融合,对表观流和运动流在高层特征之间进行学习。实验结果表明,较采用三维卷积在参数减半情况下,识别性能有所提升,该方法在NTU RGB+D大规模数据集上可以达到目前最好的识别水平。
其他文献
随着社会的进步和计算机网络技术的迅速发展,基于生物特征的身份鉴别算法由于其出色的安全性能受到了广泛的关注。在所有的生物特征识别算法中,人脸识别技术由于其易接受性、采
学位
肿瘤是多基因参与,基因与环境相互作用的的结果。传统的单基因分析疾病的方法已不能满足肿瘤研究的需求。如何将高通量生物技术所产生的巨量数据同基因组时代积累的基因、蛋白
学位
本文的目的是通过建立KKV(Kinetic Kill Vehicle)悬浮试验数学模型,开发KKV悬浮试验仿真系统软件,并对其进行系统仿真。本文希望能够结合实际的工程项目,在 KKV悬浮试验的系统设
轮桨腿一体化两栖机器人是一种既可以在陆地、滩涂、海底爬行,又可以在极浅水海域浮游的特种机器人。它巧妙地将水下机器人常用的螺旋桨推进器与陆地爬行机器人的驱动轮结合为
现实环境中的语音常常受到噪声的影响。麦克风阵列语音增强作为消除噪声提高语音质量的一种有效手段,尽管近年来取得了长足的进步,但仍不能完全满足实用的要求。本文的工作主要
学位
欠驱动系统(under-actuated systems)是指系统的独立控制变量个数小于系统自由度(或广义坐标变量)个数的一类非线性机械系统。它在减少执行元件个数、减轻系统重量以及降低成
学位
快速图像特征提取算法是图像处理和计算机视觉领域的重要研究课题。在复杂背景下基于视频的自动目标识别与跟踪中,目标特征的快速准确提取是实现高概率自动目标识别的关键技术
本文研究的主要内容为基于DSP和FPGA的火腿肠质量检测系统设计。   首先介绍了研究背景及意义和火腿肠质量检测系统原理,接着介绍了传统的专用和通用图像处理系统的结构、
本文主要研究了支持向量机(Support Vector Machine,简称SVM)在线算法及其在连续搅拌反应釜(Continuous stirred tank reactor,简称CSTR)中的应用。支持向量机是在统计学习理论和结
人类大脑皮层的形状受到遗传、发育、可塑性、性别、精神神经疾病等多种因素影响。这导致了不同人群之间,以及人类个体间的大脑皮层存在着形状差异。通过分析大脑皮层形状,我们
学位