基于深度图像的手势交互技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:weike112121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机逐步的智能化,人机交互技术越发重要。手势交互技术是一种以手为核心的直观的人机交互技术。手作为人体最为灵活的部分之一,能够传递各种各样的信息。近些年来,基于视觉的手势交互技术已经在生活、娱乐、教育、医疗和工业生产等诸多领域中得到广泛的应用。深度相机的发展进一步拓展了手势交互技术的应用空间,特别是在教育和娱乐领域,自然的交互方式更容易被人们所接受。然而现有的手势交互技术也存在一些明显的不足,比如,在开放的环境下基于肤色的分割方法容易受光照和复杂背景的影响,大规模训练数据的采集与处理耗费大量人力物力,以及传统的实现方法不能满足实时性的要求等。这些缺点很大程度上限制了该技术的应用空间。因此,要实现一种基于视觉的手势交互技术,使其同时满足自然性、易用性、易扩展性、精确性以及实时性的要求,是一项具有挑战性的课题。  本文从手势自然交互的角度出发,在充分了解国内外研究现状的基础上,结合当前软硬件的发展趋势,针对基于深度图像的手势交互技术进行了深入的研究。根据手势传递信息的方式和内容,分别探索了手势动作识别、静态手势识别和手的三维姿态跟踪的相关技术。具体的研究工作包括以下几个方面:  (1)针对手势动作识别,提出一种基于单次学习的三维连续手势动作的识别方法。首先,提出一种自适应头部模板跟踪和区域生长相结合的实时人体检测与分割方法;其次,在人体区域分割的基础上,提出一种基于三视图运动历史图像与对应的金字塔方向梯度直方图向量相结合的手势动作表示方法,针对连续的动作序列,提出一种手势动作的提取方法,包括连续动作的分割方法和动作有用帧的提取策略;最后通过图像相关性及向量相关性进行基于单次学习的手势动作识别。该方法适用于三维的手势动作识别,具备不需要训练数据的支撑和易扩展性的优点,比传统单次学习方法具有更高的识别率。  (2)针对静态手势识别,提出一种基于几何表示的实时静态手势识别方法。首先,基于深度图像,通过多次分割的方法提取精确的手势区域;其次,改进了传统的凸形状分解方法,提出一种基于半径函数的方法来计算Reeb图,加快了凸形状分解的速度;最后,在凸形状分解的基础上,提出一种基于二维骨架的表示方法对静态手势进行特征描述,并采用模板匹配方法进行识别。该方法采用单一深度图像作为输入,在识别的速度和准确率上均具备明显的优势,同时不需要训练数据的支撑,具备易用性、易扩展性的优点。  (3)针对手的三维姿态跟踪与交互及实时性需求,提出一种基于GPU的连续粒子群优化算法,实现了手的三维姿态实时跟踪。首先,定义一种手的三维模型表示方法;其次,改进了传统的粒子群优化算法,将连续优化策略加入优化过程中,进行连续跟踪,将粒子重采样技术引入到粒子群中,提高了优化跟踪的精度;再次,将粒子群优化算法通过CUDA来实现,加快了粒子适应值的计算和粒子群的更新、采样等操作的速度;最后,采用基于OpenGL的多视口并行绘制方法和几何实例化绘制技术,加快了三维手模型的绘制速度。该方法采用单一深度图像作为输入,提高了手的三维姿态跟踪的速度和精度,同时不需要任何训练样本数据的支撑。  (4)设计并实现了一种基于手势的人机交互引擎,便于上述手势交互技术的三个方面成果的应用。通过不同的应用实例验证了本文所提出的方法的实用性和高效性。
其他文献
该文在分析了计算机信息系统开发方法体系结构的基础上,对当前使用最广的两个主要开发方法:结构化方法和面向对象方法进行了深入地研究和比较,并结合作者的工程实践,对结构化
  本文首先介绍了传统调试技术的分类和特点,随后提出了一种新型的调试技术——解释执行调试技术。阐述了其原理和基于这种技术的调试器结构,并介绍了这种技术在替代硬件仿真
印制电子工艺是一种相似于微纳米加工技术的加成反应,它是采用多种油墨材料印制和热处理等一系列工艺达到形成线路或者电极以构建电子部件或者电子器件为目标的印刷工艺。本文
颜色是图像的重要特征,影响着人们对图像的视觉感知和评价。鉴于目前在图像处理技术中关于颜色渐变算法、颜色渐变类型以及描述颜色渐变区域模型的研究相对较少。为了使用客观
该论文重点讨论利用目前先进的LotusDomino/Notes群件平台设计基于Web的机关办公自动化系统.首先介绍了WWW背景知识,包括Web规范和体系结构,几种Web应用开发技术.然后对机关
学位
该文基于小波分析和FBM模型分别实现了两种图象纹理分割算法,有效地检出了菌落图象中对分类最有意义的中间隆起部分,为后继工作奠定了基础.菌落形貌牲的定量描是实现菌种自动
针对连续工业生产过程特点和过程控制目标,该研究报告提出并讨论过程鲁棒优化控制问题.针对过程鲁棒控制理论研究和应用现状,指出存在的问题,分析产生的原因,然后从几个方面
信息化社会中人们工作的特点是群体性、交互性、分布性和协作性.计算机支持的协同工作(CSCW:Computer Supported Co-operative Work)作为一种将人类合作行为模式与计算机技术
分类精度和学习速度是评价分类器性能的两个主要指标。现有多层感知器(Multilayer perceptrons, MLPs)及其学习算法能有效解决中、小规模即样本数、维数和样本类别均比较小的