基于骨骼和深度模型的一类人体行为识别方法的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:fang514
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为理解逐渐成为计算机视觉方面的研究热点,无论是在监控,人机交互和机器人领域都有着广泛的作用。近几年市面上出现了一款新型的图像、音频采集平台,也就是大家熟识的Kinect。它不仅能提供传统彩色相机提供的彩色图像还可以输出深度图像,更进一步的在深度图像的基础上给出人体骨骼图像。然而,当前Kinect平台主要被用来实现人机交互、休闲娱乐。殊不知Kinect所拥有的丰富资源能够大大丰富人体行为理解方面可以被利用的资源。本文借助Kinect平台在有限的场景范围内对人体行为做一些理解研究工作。初期了解人体行为理解的研究背景和国内外研究现状以及常见算法,在熟悉Kinect平台的基础上搭建实验测试平台,同时设定实验测试环境。分别对彩色图像信息,深度图像信息和骨骼图像信息做了详细的测试。其中包括图像的分辨率,每帧速率;深度图像的有效使用范围,分辨率;骨骼图像的有效范围,遮挡问题等一系列的内容进行详细的测试,确保Kinect平台搭建的有效性,以帮助实验测试环境的选取。同时有助于行为特征的提取,以及测试行为理解算法的有效性。视频中人体行为理解的一个重要问题是特征的选取问题。良好的特征能够有效地描述人体姿势、行为,可以说好的特征是能够正确理解人体行为的基础。文中选择了人体骨骼特征,包括人体骨骼关节的角度、方向、相对位置,还有人体轮廓的高度和宽度的比值等参数。在实验测试中发现这些特征性能优异,但是仍存在一个无法避免的问题——遮挡问题。当Kinect骨骼图像中关节点存在遮挡时,所给出的数据存在一定的不确定性,即部分被遮挡部分的数据会存在跳变现象,这对被提取特征的有效性产生了影响,国内外在遮挡问题上都没有提出很好的解决方法。深度图像反映客观的人体姿势,被遮挡部分不会出现骨骼数据中的不确定性,而且数据的鲁棒性较好。通过HOG算法提取深度图像中人体姿势特征,结合骨骼特征,共同构成描述人体行为的重要特征。人体的行为可以被分解成姿势序列。文中将行为理解分成两部分,一部分通过提取的特征做姿势识别;另一部分,理解人体姿势序列实现人体行为的理解。所涉及的算法也分别针对这两个不同的任务。在特征提取中首先提到了HOG算法,它主要是提取深度图像中的人体姿势特征。SVM算法经过测试有较好的识别效果,文中采用被广泛使用的LIBSVM算法。在行为理解方面即序列分类问题上,贝叶斯方法有着较好的表现,在这里研究了基于贝叶斯理论的朴素贝叶斯算法,隐马尔科夫算法在行为理解中的有效性。最后在Visual Studio平台上设计测试系统,完成图像数据的读取、显示、实验测试对比和提示等功能。通过大量的实验测试,发现在姿势-序列这样的理解架构下,借助支持向量机和贝叶斯方法能够有效的实现人体行为理解,并且能获得较好的识别效果。本文的研究具有一定的应用和研究价值,能够为后续的开发和研究提供经验。
其他文献
纹理合成及纹理映射是三维模型获得真实感的重要技术,是计算机图形学领域的研究热点。纹理合成和纹理映射在虚拟现实场景、三维动画制作、游戏以及虚拟博物馆等领域得到了广
核磁共振(MRJ)脑图像的颅内各组织边界复杂且不规则,所以对其的分割是医学图像处理一个重要而困难的课题。支持向量机(SVM)是一种全新的模式识别技术,其思想是建立在统计学理
小波变换可以实现对一维信号的稀疏表达,并且自1995年Donoho等人提出阈值方法之后,基于小波变换的阈值去噪方法得到了广泛的研究,并取得了良好的效果。图像具有多方向性和各
最后,针对每个模态都存在执行器故障的垂直起降飞机切换系统模型,设计三个具有级联结构的扩张故障诊断观测器系统分别估计每个模态的未知故障信息,利用最优控制技术和积分滑
随着网络技术和多媒体技术的迅速发展,媒体影视数量不断增加,如何在海量存储库中寻找自己感兴趣的视频成为一个新的问题。尤其是随着智能手机的普及和三代视频(3G)的到来,如
本文研究的目的是建立一个统一的分词,聚类,语义空间模型。我们使用了面向对象的方法,有利于本系统的结构的升级和修改。   本文主要的工作由三部分组成:分词,聚类,使用分词、聚
作为一种基于可达图的死锁预防策略,区域理论能够保证网系统的最大许可行为。但是利用它对Petri网进行死锁控制的瓶颈在于网模型状态空间随网规模的指数级增长以及由此而引起
随着科学技术的进步和工业生产的发展,对多组分气体检测和分析的要求不断提高,但是现有的检测手段越来越不能满足需要,因而将低成本、高性能的气体传感器阵列与盲信号分离技术相结合,来分析混合气体的浓度。所选择的气体传感器只要具有宽响应范围均可使用。由于CO和CO2的红外吸收波段重叠,使用红外气体传感器测量这两种气体浓度时就会带来误差,用盲信号分离技术对观测的数据进行分析,便可以提高气体测量的精度。本课题的
ZigBee技术是为无线传感器网络技术设计的一项新兴的低成本、低功耗的短距离无线通信技术。ZigBee网络路由算法是ZigBee协议的核心技术之一。本文主要研究的是ZigBee网络的路
在流程工业中控制系统本质上是非线性的,线性对象比较少见,一般研究时将非线性过程近似为线性过程。据统计,流程工业过程中有大约30%的回路处于振荡状态,其中1/3是由于调节阀