基于双目视觉的手势交互系统的算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lnlsq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机交互系统以一种定义好的方式进行信息之间的相互交流,常见的交互方式包括语音、字符、手势等。手是人身上最灵活的部位之一,手势是人与人之间相互交流的重要方式并且在特定环境中通过手势进行交互是一种更加人性化、合理化的方法。手势交互系统凭借其价格低廉、非接触式的特点在家庭娱乐、机器人控制、手语交流、智能穿戴等领域具有广阔的前景,因此手势交互的研究成为近几年的研究热点领域之一。  本文主要研究手势的跟踪以及识别算法,然后在此基础之上构建出一个基于Android平台的动态手势识别系统。用户通过该系统能够更加人性化地和“电视盒子”进行交互,在游戏操作的过程中具有更好的体验效果。论文的主要工作包括:  1.为了提高手势识别的准确率,在手势分类模块提出利用卷积神经网络进行手势的分类工作。相比传统的分类算法,基于卷积神经网络的分类算法的识别率能够达到95%,得到了较好的分类效果。  2.卷积神经网络能够提取到具有高级语义的顶层特征,为了提高手势跟踪的精度。文章提出一种新的算法,在卷积神经网络的高层特征映射空间利用核相关滤波算法进行手势的跟踪过程。核相关滤波算法利用循环矩阵在傅里叶域的特殊性质,能够将传统跟踪算法的平方时间性能较低到线性时间,文章证明了在卷积空间进行核相关滤波的算法合理性,并通过实验展示新的算法的跟踪效果。  3.针对跟踪过程中出现的手势在类似背景情况下容易出现跟踪丢失的现象,文章提出利用双目立体视觉来对跟踪目标周围的环境进行立体建模,从而获取目标的三维景深信息,依据景深的不同将手势和类似的背景成功地区分开来。通过双目立体视觉来补充上面提出的跟踪算法的不足,使得跟踪算法具有更好的适应性。并通过测量静物的景深实验表明在一定的距离范围内,通过双目视觉获取景深的精度是可以接受的,达到了手势交互系统的精度要求。
其他文献
伴随着计算机和网络技术的不断发展,数字化校园建设得到空前发展,而作为其中十分重要的办公自动化系统也越来越受到重视。网络安全作为重要的一个问题也频繁地被人们提及,安全方
本论文的课题就是为了解决检测这类型的网络访问事件并追踪、定位访问者或攻击者的真实来源,就成为当前的研究热点和困难问题而提出来的。论文首先对于相关技术,包括安全审计、
本文对医学图像融合的理论、方法和技术作了全面、细致的研究。首先对研究背景以及医学图像融合的有关概念、分类及方法进行了综述,然后分别深入研究了单模医学图像的配准、多
随着半导体技术在过去几十年的飞速发展,片上多核处理器(MPSoC)在科学计算、无线通讯、多媒体、互联网、物联网、安全等领域得到了广泛应用,其应用渗透到人类生活的各个方面。
旅行商问题(TSP)是一个有着重要工程背景、在图论中的典型组合优化问题,己被证实是一个NP完全问题.该文将解决TSP问题转化为一种特殊的最短路问题.通过构造耦合神经网络,使得
人类已步入信息时代,物质、能量、信息是人类赖以生存的三大资源。以计算机为核心的现代信息处理和以数字化通信为特征的现代信息传输正在紧密地结合起来,将人类带入到未来崭新
随着经济体制改革的不断深化和信息技术的飞速发展,越来越多的企业、公司需要跨地区、跨省,甚至跨国经营.企业信息来源于企业数据,数据是企业信息系统的核心.信息的分布式处
本文主要论述的是如何在蓝牙设备组成的微微网中进行合理调度,从而提高数据传输效率的问题。在当今蓝牙设备使用日益广泛、蓝牙网络拓扑结构日益复杂的情况下,一个庞大的蓝牙散
入侵检测系统作为一种动态防护体系,首先从计算机系统和网络中的不同关键点采集信息,然后通过分析这些信息来确定入侵的迹象,其本质还是一个聚类、分类的问题.支撑向量机是与
智能体(Agent)的概念起源于分布式人工智能(DAI),其相关的理论和技术,尤其是多智能体系统(MAS)和面向Agent的编程(AOP),已经越来越广泛地被应用于知识表示、DAI、Internet数据开