基于3D骨架片段表示度量及流形分割的人体动作识别

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:tomlibu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于人体动作识别在包括视频监控、人机交互娱乐、个人护理以及社会服务等方面的广泛应用,人体动作识别已成为当下计算机视觉领域最受重视的研究方向之一。人体动作识别的目标是让机器从一段视频中自动分析和识别所包含的动作。然而,动作视频中所固有的背景复杂、人体遮挡以及摄像机移动等问题,使得人体动作识别任务具有极大的挑战性。传统的研究工作专注于从二维视频帧图像中提取图像的局部时空特征,近年来,由于深度摄像机如微软体感摄像机Kinect以及与之对应的人体3D骨架坐标追踪算法的出现,促进了基于深度图像和人体3D骨架信息的一系列新的人体动作识别方法的发展。与二维视频帧图像相比,深度图像能够反应纯粹的几何和形状线索,且对照明条件的变化不敏感,因而基于深度图像的识别方法在实际应用中更具鲁棒性。与基于图像(RGB及深度图像)特征的人体动作识别方法不同,本文使用3D骨架信息表示人体动作:一方面,3D骨架信息在人体动作识别工作中的表现比其它基于视频帧图像特征提取的方法更好;另一方面,基于姿势序列的动作表示描述了人体动作的固有特征且符合人类自身对动作的学习认知过程。本文将人体动作局部基于3D骨架信息表示为人体姿势,整体上一系列姿势点看作人体动作流形,两者共同构成文章方法的主线。进而提出基于3D骨架片段表示及流形层次化分割和基于3D骨架片段距离度量及流形序列化分割两种人体动作识别方法。研究基于视频及其对应人体3D骨架坐标信息的动作识别问题,从视频的分割、分割片段的表示以及全局时间关系的处理三方面解决了人体动作识别问题。本文的主要工作和特色如下:(1)使用人体3D骨架信息表示人体动作,进而将人体动作(由人体姿势序列组成)当作流形进行处理;(2)基于3D骨架信息,提出主姿势特征和主要动作趋势特征表示人体动作(片段)并度量动作(片段)间的距离;(3)基于人体动作流形局部线性性度量实现人体动作的分解,利于表示及识别分类任务;(4)提出了两种人体动作识别方法,并在几个流行的人体动作数据集上进行实验,证明了所提方法的有效性。
其他文献
传统的机器学习方法假设训练集和测试集来自同一分布的样本集,如果实验数据的分布改变了,需要重新标注新样本作为训练集建立统计模型,然而标注新样本的代价通常很高,采用迁移学习
信息系统安全的紧迫性和网络通信安全的重要性使人们越来越对分组密码的相关理论感兴趣,分组密码的设计与分析也一直是密码学中的热点课题。分组密码作为现代密码学中的一个重
网络钓鱼攻击主要是通过邮件方式传播的,大量的网络钓鱼攻击使得用户遭受到巨大的经济损失。巨额的损失导致用户不信任网上银行和电子商务网站,并严重影响到电子商务的发展。
在许多真实的网络中都存在模块或社区。社区的检测是社会网络学习的重要的课题,对于我们了解社会网络的内部关系和结构,进而应用到与社会网络相关的很多领域都有重要的意义。传
词语是构成文本的最小语义单元,很多自然语言处理任务都会涉及词语表示的问题。词语表示的方法最常见的是独热表示.然而此方法存在稀疏问题,且不能捕捉词语间的语义联系。以
随着信息技术的不断发展以及软件系统规模的不断扩大,开发大型软件系统所耗费的时间和成本也不断增加。而人机界面设计在软件开发中变得越来越重要,同时也变得越来越复杂,成为制
近年来Web发展迅速,将Web作为信息源的Web信息抽取也成为数据挖掘研究的一个重点。对Web信息抽取的研究已经取得了显著的成果,提出了各种各样Web信息抽取的方法,同时Web信息抽取
数字社区是数字地球、数字城市的单元节点,具有行政管理、资源共享、大众服务、监控监管、商业服务等多项功能。由于其异构、跨域、动态变化的特征,数字社区网络中原子服务及组
Ad Hoc网络是一个多跳、临时性的自组网络,由多个移动终端组成并且都可以依靠自身发送或接收信息。由于,网络中所有的节点可以自由移动并且所处的地位相等,因此,在网络中不需