人体运动判别特征提取及分类方法研究

被引量 : 0次 | 上传用户:caway1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类每天连续地从事着大量的活动。我们不自觉的识别理解这些活动,同时跟其他人与环境进行互动和交流。如果机器跟计算机也能像人类一样有效的理解到人类的手势,一个新世界的篇章将被翻开,充斥着大量的协助人类生活的应用。这个对社会重大的利益将激发基于机器的手势识别的研究,这些研究已经在大量的应用中展示了一些初级的优势。例如,手势可以用来对机器人发送指令,或者代替例如触摸屏或者鼠标等便准输入的计算机程序。  本文提出了一种基于抽取自RGB-D数据的时空特征的人类手势的识别系统框架,此系统能够有效的抽取特征及有效的识别人类手势,其中一个单独的用例也是可以有效的用来训练。通常说来,我们的框架大致分为两部分,特征抽取及分类。它们两者都严重的影响着识别的效果。  1.Shi-Tomasi边缘检测算法被用来检测一幅图像中运动区域的关键兴趣点,在每一帧的GRB跟深度图的不同层次上。当检测兴趣点时,可能会检测到一些无效的点,所以我们应用了Lucas-Kanade跟踪及过滤方法。使用Lucas-Kanade方法,每个在金字塔不同层次上的兴趣点的速度都被计算出来。然后,只有满足运动约束的那些点才被筛选出来。  2.改良的GradientLocation and Orientation Histogram(GLOH)被应用到鲁棒的关键兴趣点描述子的捕获中。改良的GLOH从原始量的16bins降低至8bins从而生成了136个描述子向量。识别率几乎是想等的,但是计算时间几乎是改良的GLOH的一半。  3.为了学习判别性模型,从训练样本中提取的所有特征采用K聚类的方式,来学习一个视觉码本。我们使用SOMP的稀疏编码方法来获得描述码,该描述码将每一个特征映射到某个视觉码本中。  4.为了识别手势,我们提出一种基于K近邻的分类方法来学习和分类手势。对于一个训练集中的每一个视频,产生本地动作。所有产生的数据集都被聚类。使用K近邻的方法来分析测试集中的手势。根据对给定的手势进行投票,按照识别的概率,视频可以被分类。在对CGD的动作识别中,我们提出的框架的有效性和可靠性得到了证明。
其他文献
伴随着科技进步和全球信息交流的日益扩大,嵌入式设备产品的市场规模在迅猛发展。追求小体积多功能是嵌入式设备的必然趋势,语音通信技术在嵌入式中的应用成了最具吸引力的功
粗糙集理论是一种处理不精确、不确定和不完备信息的数学工具,它能有效地从数据本身提供的信息中发现有效的、潜在的知识。将粗糙集应用于数据挖掘领域,能提高对数据进行分析
随着软件系统复杂程度的增加,软件系统的体系结构设计越来越显得重要,基于架构、组件式的开发是目前企业级应用开发的主流,良好的多层系统体系结构,可以使企业完成复杂系统的快速
随着通信技术和半导体技术的飞速发展,以及人们对无线接入技术的需求日益增长,无线通信和无线网络均呈现出指数增长的趋势。这有力地推动了无线通信向高速通信的方向发展。然
随着P2P的发展,P2P技术对互联网、商业和人们的生活都产生了巨大的影响,P2P技术也成为当前分布式计算领域的研究热点。P2P网络模型的发展经历了三代的演变。第三代P2P网络模型
装箱问题是最经典的组合优化问题之一,同时也是算法分析理论中研究的重点。装箱问题源于现实生活,有着极为广泛和深厚的应用背景。例如装箱问题在多处理器调度、资源分配和日
现代远程教育作为创新型服务业得到越来越多人的关注,并且取得了一定的发展,然而当前的各类现代远程教育系统缺乏教师与学生的情感互动,教师无法针对学习者的学习情况实施因
随着信息社会对安全的要求不断提高,利用生物特征进行快速准确的身份识别成了当今的主流。与传统的身份鉴定手段相比,生物特征识别具有无可比拟的优势,特别是步态识别技术,由于其
移动Ad Hoc网络(Mobile Ad Hoc Network MANET)是由一系列动态主机节点临时组成的多跳无线网络,与基于固定基础设施的网络相比,它具有无中心、自组织的特点。节点兼有主机和
数据库的发展经历了三个阶段,第一代是以技术为中心的前关系型数据库,也称为非关系型数据库,始于二十世纪六十年代,主要是层次数据库和网状数据库,这一类数据库过程化程度较高,一般