基于Kinect的手势动作识别技术研究

来源 :长春理工大学 | 被引量 : 1次 | 上传用户:Fish_FF1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势识别是计算机领域中一个重要且具有挑战性的研究课题,同时作为人机交互的重要组成部分,其发展影响着人机交互的自然性和灵活性。然而,传统手势识别方案以彩色及深度图像为研究对象,在特征提取时常常受到肤色、复杂背景、遮挡重叠等因素干扰,难以准确地分割手势。在分类阶段,传统分类模型存在着样本需求量大及识别率低等缺点。因此,本文利用Kinect深度传感器获取的骨骼信息为研究对象,以减少应用场景对特征提取的影响;并针对两种手势动作识别问题分别设计了特征提取方案,即:人工设计提取几何特征和双路卷积神经网络(Convolutional Neural Networks,CNN)提取随机特征;此外利用长短期记忆网络(Long Short Term Memory Network,LSTM)构建分类模型对手势动作进行识别。本文主要研究内容如下:(1)鉴于手势动作识别可以视为时间序列分析问题,本文利用LSTM对序列的上下文信息进行建模。同时,为了将手势序列的多个时间尺度信息在全局范围内得到融合,实现输入数据的高级抽象,构建了多层级LSTM堆栈的分类模型。并通过对比不同层级堆栈的实验结果,确定了四层级LSTM为最佳堆栈层级。(2)针对手与手臂形成的手势动作识别问题,本文利用骨骼信息对手势动作进行表征,并人工设计提取了三种几何特征用于描述手势动作。同时,结合LSTM模型构建了基于几何特征的多层级LSTM手势识别框架。其实验结果验证了本文所设计的几何特征和相应手势识别框架在识别手与手臂形成的手势动作中的有效性。(3)针对包含手形的复杂手势动作识别问题,本文将手部区域图像和骨骼信息时空特征的彩色编码图像作为双路CNN的输入来提取高层次的随机特征,并构建了基于随机特征的多层级LSTM手势识别框架。其中针对手部区域小、易混淆等问题,提出了一种多尺度加速区域卷积神经网络(Faster R-CNN)以获取手部区域图像。实验结果表明,上述方法能够很好地处理复杂手势动作识别中手部区域获取和特征提取问题,其在自定义数据集上达到97.834%的识别率。并对比分析了各类识别方法在大型公开“NTU RGB+D”数据集的评估实验结果,验证了所设计方案的优先性。
其他文献
表面肌电信号(Surface Electromyography sEMG),是一种电信号,并且在人体的无创肌肉检查时,也是一种非常有效且使用的办法,我们分析研究表面肌电信号的检测和分析方法,而本文
静电层析成像(Electrostatic Tomography,简称EST)具有实时性高、可视化、成本低、无辐射等优势,可为滑油磨粒在线监测提供一种新型手段。但EST技术被动感应机理获取的有效信
无人水面艇是一种可执行侦查、搜索、反潜、水文监测、地理勘察等任务的高性能、智能化、信息化、自主化的海上利器,性能优良的无人水面艇必须具备操纵性好、机动灵活、实用
图像融合技术是将不同成像机理的传感器或者同一传感器在不同条件下对同一场景图像进行获取后生成符合人类观察或者计算机处理的图像,得到的图像比源图像信息更加丰富和准确,
随着工业化的迅猛发展以及人类生活水平的不断提高,大气环境的污染呈现愈发严重的趋势,因此气体传感器在我们的日常生活中发挥着越来越重要的作用。它们可以检测生活场所的有
图是无处不在的数据结构,可以用于表示人,计算机,生物和遗传交互以及非结构化网格中的元素之间的关系。许多实际问题和应用,比如生物信息学,社交网络分析和流量工程,都可以通
中微子是宇宙中最基本的粒子,研究中微子有利于人类探索宇宙奥秘,对于推动人类物理学发展有着重要的意义。目前我国建立了大亚湾中微子实验站对中微子进行测量,通过核心部件
光电化学(PEC)传感器是基于纳米功能材料的光电转换性能发展起来的一种分析检测方法。近年来,PEC适配体传感器因其装置简易、成本低、灵敏度高,而且巧妙结合适配体靶向识别特性
路基是道路的承重部分,承受着道路上部过往车辆及其自重的荷载,路基的稳定性如果降低,道路上部结构将会受到影响,为道路埋下安全隐患。若路基失稳,道路上部结构也就无法继续
近年来,针对图像去噪问题提出了很多网络去噪框架,经深度学习方法处理后的图像质量高于优于传统的去噪模型。但是,基于深度学习算法的缺点尚未找到解决办法,如不可解释性和不