基于立体视觉的手形手势识别研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:yunguii
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅猛发展,人机交互也越来越成为日常生活中一个不可缺少的部分,人机接口技术的发展也越来越快。传统的鼠标键盘等人机交互手段虽然越来越向方便快捷性方向发展,但是在人机交流的自由性和自然性方面还是不很理想。一种符合人们在日常生活中的交流习惯的人机交互技术越来越受到青睐。因此近年来兴起的基于视觉的手势交互逐渐成为人机交互领域的研究热点,它使得人机交互更加自然、更加人性化。这项技术在家电控制、机器人控制、哑语教学及游戏控制等方面有着广泛的应用前景。由于手本身不是刚体,所以做出来的手形手势具有多样性和多义性,即使是同一个人的做出的同一个手势在不同的时间里也不是完全一样的。而且手势识别所涉及到的学科广泛,包括数字图像处理、模式识别、人工智能及计算机视觉等学科,因此基于视觉的手势识别是一个极富挑战性的研究课题。手势分为静态手势和动态手势两种,静态手势就是指手势在某个时间点的姿态、形状即手形,动态手势指的是手在空间中的运动轨迹。本文主要研究基于计算机视觉的静态手形和动态手势的分割及识别等方面的相关内容。由于摄像头采集到的都是空间物体的二维投影信息,物体在由三维空间向二维空间投影时必不可免地会丢失一些信息,由于单个摄像头采集到的手势信息可能不全面,为了使得采集到的图像信息能更真实贴近地反映物体的本来面目,本文采用两个摄像头从不同视角对手势进行图像采集,对采集到的两幅图像相互参照,减少误识的发生。本论文的研究内容包括下面几个部分:1.在手势分割方面,对比研究了一些常用的分割方法。利用肤色模型法实现了静态手形的分割,通过对采集到的视频流进行差分运算,分割出运动区域,然后在此基础上利用肤色模型法实现了手形手势的分割,对分割出来的手势进行相关的后处理,如空洞的填充、孤立噪声点的去处,使得分割出来的手势更加准确。2.在手势特征提取方面,对常见的手势特征及特征提取方法进行了详细的研究。特征包括几何不变矩、区域重心、手指个数等,由于本文选择讨论的手势比较简单,利用手指个数作为静态手形的特征矢量,对动态手势则采用手势区域的重心位置和手指数这两个特征来作为其最终的特征矢量。3.在手势识别方面,对手势识别过程及方法进行了相关研究,采用隐马尔科夫模型来实现手势的训练和识别。
其他文献
知识处理是信息技术发展的必然趋势,随着对知识应用要求越来越高,传统的知识库系统已经不能满足新的需求。而得益近几年语义网(SemanticWeb)的迅速发展,构建起了一套比较规范的
随着视频监控应用的广泛发展,网络视频监控系统逐渐成为视频监控领域的主流。为了在有限带宽下高效传输符合质量要求的视频图像,联合视频工作组JVT(Joint Vedio Team)在2003
汽车轮毂自动识别系统主要是研究了一种机器视觉系统,这种系统能够识别流水生产线上不同款式、不同型号的多种汽车轮毂。这种识别系统的优势在于:非接触性、在线实时性、高精
在当今信息爆炸的时代,海量数据不断涌现,而且这些数据仍在以每三个月增长一倍的速度持续增长着。因此,如果不借助有效的信息挖掘方法,这些异构海量数据将可能最终变成无人关
近年来,软件的可信性问题再度引起广泛关注,航空、核工业、电信、金融、电力和交通等国家重要领域的信息化程度日益提高,国家基础设施的运转越来越依赖于大型分布式软件系统,
聚类技术是用于数据分析的最常应用的技术之一,其应用领域涉及统计学、计算机科学、生物学以及社会学等。传统的聚类算法如常见的K-means算法,EM算法等都是建立在凸状分布的
随着Internet的飞速发展,网络已经成为对外宣传以及了解世界的窗口。万维网(World Wide Web)为人们提供丰富信息的同时,也留下了用户浏览页面时的大量访问信息。如何利用这些
话题检测与跟踪(TDT)作为一项帮助人们解决信息过载问题的研究,它通过对新闻流中新话题的识别和追踪,将某个话题相关的报道聚集并呈现给用户。但新闻话题的浏览不应该局限于扁
现代密码技术作为信息安全的基础受到了广泛的关注和高度的重视,提出能适应各行各业且安全性较好、成本较低廉、结构较简单的认证加密工作模式已成为现代密码技术研究的热点
自从1991年Internet上万维网公共服务的首次亮相,各种各样的信息就以指数级的增长速度充斥于Internet中,人们寻找信息的方式也随之发生了变化。从最原始的手工查找,到书签服务,再