基于深度图像的人体姿态识别

来源 :北京工业大学 | 被引量 : 20次 | 上传用户:judehui01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态识别是计算机视觉领域的一个重要研究方向,它在众多领域具有广阔应用前景,比如智能监控、高级人机交互、人体运动分析等。但是碍于普通光学图像容易受光照、阴影等外界变化因素影响,人体姿态识别的研究一直没有取得突破性的进展,直到近几年随着深度传感设备的发展,尤其微软公司推出Kinect深度传感设备之后,人们对从深度图像中识别人体姿态产生了极大兴趣。到目前为止,已经有很多先进算法提出,并且有些已经取得了较好的研究成果,其中具有影响力的是Shotton等人利用Kinect实现了实时的人体运动捕捉,尽管该捕捉系统在一定程度上满足了人们对实时性的需求,但是该算法不适合低分辨深度图像中的人体姿态识别,同时由于大数据集的计算复杂度较高,该算法对训练平台的性能要求也极高,为此,以实现较高准确率的基于低分辨率深度图像的人体姿态识别为目的,本文通过分析深度图像的成像原理,利用计算机图形学技术构建了人体姿态深度图像库,在普通PC上利用分类器模型来检测人体部位,用聚类算法实现人体关节点预测。本文主要的研究工作有以下两个部分:1)鉴于目前没有公开的人体姿态深度数据库及相关构建方法,本文利用基于计算机图形学技术的Maya平台及已有的CMU运动捕获数据库来构建低分辨率的人体姿态深度数据集。相比于利用深度传感器获取深度图像,人工再逐个标注人体部位而言,本文的方法不仅节省了人力和精力,同时人为误差较小且不易产生分类灾难,更重要的是涵盖了人们日常常见的运动中的姿态序列。2)采用了经典的随机森林分类器模型检测人体部位,其中像素的深度差分特征作为随机森林的训练特征。在关节点预测阶段,采用了加权Mean Shift(均值偏移算法),并且针对低分辨率图像容易出现人体骨架扭曲问题,提出了部位合并思想。本文中人体姿态深度图像库的构建理论与思路尤其对基于深度图像的计算机视觉任务的研究具有一定的参考价值。
其他文献
随着人们步入信息时代,人们的日常生活及工作已越来越离不开各种信息数据的处理。日益增长的信息存储量,庞大的用户查询次数,拥塞的网络都使得数据的查询和执行效率成为了一个瓶
该文先将动态车辆视频压缩图像采集到计算机中,并实现了自动将其转化为静态图像序列.经过噪声滤除后,该文采用了一种边缘加强和图像相三的算法,可以把车辆从复杂背景中提取出
随着互联网的快速发展,海量、分布、异构、动态变化的各类信息不断涌现。如何从这些海量信息中挖掘出用户感兴趣的知识,成为当前研究的重点之一。主题模型做为一种近些年兴起的
随着互联网技术的迅速发展,网络承载的业务数量日趋庞大,种类日趋复杂。与此同时,用户对业务主观要求的日益提高,对网络如何有效保障业务的服务质量(Quality of Service,QoS)提出
统计机器翻译是近年来自然语言处理领域最受瞩目的研究热点之一,具有重要的学术研究价值和广阔的应用前景。目前统计机器翻译已经经历了基于词的模型、基于短语的模型、基于句
该文基于黄等所提出 的识别方法,通过定义一类更广泛的隶属函数,获得了含有可调参数的分类器,从而将黄等的分类器作为该文方法的一个特例.借助投影算子理论、子空间理论,对
随着信息技术的发展,大量信息充斥着各类互联网平台,如电子商务平台,社交网络平台和在线教育平台等。而人们精力有限,只能处理非常有限的信息,这就是信息过载问题。为解决这一问题
该文论述了作者在硕士学位论文工作期间在基于Web 的瘦客户计算领域所做的研究工作和实践工作,主要工作围绕着湖州市电力局分布式物资管理信息系统中的两个应用:查询和企业报
近年来,无人机技术发展迅速,广泛应用于军事和民用领域。随着应用的推广,人们对无人机的自主性和智能性提出了更高的要求。无人机实现自主飞行的先决条件是其具备有效的同步定位
大数据时代数据的爆炸式增长,为人们发现隐藏在海量数据中的知识,实现数据驱动的科学决策提供了宝贵机会。文本数据作为广泛存在的一种数据类型,蕴藏了大量待发现的知识。文本挖