基于Kinect骨骼数据的人体动作识别方法研究

被引量 : 0次 | 上传用户:bvhd5467h
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代技术的发展,人们对智能化生活的要求越来越高,计算机视觉和模式识别技术作为推动人类生活智能化的重要技术,获得广泛关注并取得快速发展。作为计算机视觉重要研究方向的人体动作识别技术涉及到多个领域,具有巨大的使用价值和应用前景,无数研究工作者针对这个课题进行了大量研究,该课题已发展成为当前最热门的研究课题之一。早期动作视频处理技术都是基于彩色RGB图像的视频处理方法,由于彩色图像均由二维数据构成,图像易受光照影响,处理程序繁琐且效果不佳,所以寻找新的图像表征方法成为人们的共识。Kinect深度传感器的出现使我们能够获得深度图像,深度图像包含图像深度信息和人体骨骼点信息。本文基于Kinect提取的骨骼点信息,对人体动作识别方法进行以下研究,主要内容包括:第一,阐述人体动作识别课题的研究背景和意义,分析当前国内外人体动作识别领域现状和尚待解决的问题。掌握动作识别的具体流程,深入分析目标检测、特征表示、特征提取和分类识别等主流方法的优缺点。认识并研究了当前已有的人体动作数据库以及Kinect工作原理。第二,本文提出了一种基于骨骼局部空间特征的人体动作识别算法。该方法首先通过骨骼数据提取人体骨骼关节点的空间位置差特征、空间角度特征和关节夹角特征,并进行归一化,然后将得到的特征送入隐马尔科夫模型分类器进行分类和识别。通过在MSR3D Action数据库上仿真实验,证明该方法对于较复杂的动作序列的有较好的识别效果,并且在高难度的交叉测试中相对已有方法识别率有所提高。第三,考虑到人体动作序列的时序性,提出了一种基于骨骼词袋特征模型的人体动作识别算法。该方法在提取局部空间特征的基础之上,加入图像序列的帧间特征,并利用词袋特征模型对动作进行特征编码表示,同时引入时域金字塔匹配模型对动作词袋特征进一步划分并生成最终的动作描述子,以充分利用动作序列的时域特性,最后使用支持向量机进行分类。在通用数据集上的测试表明该方法有较好的识别效果。
其他文献
大规模MIMO系统在基站端部署大规模的天线阵元,利用空间复用、传输分集和波束赋形等挖掘空间增益,有效提升谱效和能效,是5G的关键技术之一。但由于基站天线数量可达上百支,密
水文将认知无线电技术应用于智能电网的通信网络中。针对智能电网的通信对无线频谱的需求,本文拟将智能电网中的通信用户,如家庭的智能电表,组成认知用户系统;并将认知用户系统基站与LTE移动通信网络的主用户系统基站合并,以方便智能电网中的通信用户作为认知用户使用LTE移动通信网络中的授权频段。为此,针对LTE移动通信网络采用OFDMA(正交频分的多址方式)来区分主用户且采用蜂窝网络架构的特点,本文提出了共
低密度奇偶校验码自从被重新发现以来一直受到研究人员的普遍关注,它具有接近香农限的良好性能和线性复杂度的编译码算法,DVB-S2标准和多个IEEE工业标准都采用了LDPC码作为纠错
随着通信技术和互联网络的不断发展,急剧增长的数据规模和日趋多样的业务需求对通信系统的服务能力提出了越来越高的要求。数字喷泉码是近些年来提出的一类新型前向纠错编码
分析了风力机特性、永磁直驱电机模型、变换器控制策略及各种功率跟踪控制算法优缺点,并提出一种基于爬山搜索法的最大功率点跟踪(MPPT)控制方法的优化.在MATLAB/Simulink环
随着互联网技术的快速发展,微信以及微信公众平台对人们的生活与工作都产生着巨大影响,教育行业自然也不例外,在方便移动学习同时,也为移动互动教学提供了大量的技术支持.究
随着移动互联网终端的迅猛发展,移动用户对互联网应用的需求不断增长,导致数据流量呈现爆发式增长的状态,而运营商在数据流量的传输中一直充当数据管道的消极角色,移动数据业务的
文化教育强调的是在坚持以经济建设为中心的基本原则的前提下,不断巩固文化教育的主要地位、整合宝贵的教育资源、提高思想认识水平以及增强文化教育成效.基于此,本文在简要
无线光通信的研究可以追溯到上世纪70年代,人们研究的重点是红外无线通信。因为红外频段具有低成本的红外光源和检测器。最近发光二极管(Light-emittingdiode,LED)的一些优点使
静态图像中的目标检测技术能够根据视觉特征对图像中包含的目标进行检测定位和内容识别,并能获取目标的一些具体状态参数。该技术在图像检索、人机交互、场景监控以及机器人视