复杂场景下的手势分割算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:gaolch004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机交互(Human Computer Interaction,HCI)技术为人与计算机之间信息沟通提供了一个良好便捷的途径,因而成为了目前计算机领域的一个研究热点。基于视觉的手势识别(Hand Gesture Recognition,HGR)作为一种受到广泛关注的技术,在理念和实践上可以很好地应用于人机交互场景。具体而言,基于视觉的手势识别技术指的是通过摄像机等采集设备来获取包含操作手势的视频图像,然后对视频图像进行相应的处理,如手势分割、手势特征提取、手势特征分类、手势跟踪等,从而实现了用户与智能设备之间的信息交互。  手势分割是手势识别算法的初始关键步骤,保证其良好的效果是实现手势准确识别的先决条件。手势分割的方法多种多样,但是站在实践和应用的角度来看,几乎无一例外的,这些方法仍然在准确性、稳定性以及速度上面临着巨大的挑战。在复杂的应用场景下,杂乱的背景和非均匀的光照等都会对手势分割效果带来巨大的影响,另外,手势是一种非刚性物体,其轮廓、角度、大小、位置的多样性也为精准分割带来了困难。  因此,如何在复杂的应用场景下,充分结合有效的目标检测方法以及手势的先验信息,设计高效准确的手势区域分割算法来克服以上问题,是本文所要着力实现的目标。在分析前人研究成果的基础上,本文提出了基于显著性与肤色检测的静态手势分割算法和基于暗通道先验的静态手势分割算法。  基于显著性与肤色检测的静态手势分割算法。针对复杂环境(室内/室外,有/无近肤色背景干扰,不同手型等)下的背景特点,先后使用了基于SLIC的图像预分割、一种像素级的手势区域检测方法、一种区域级的手势区域检测方法、基于贝叶斯框架的多显著图融合等。最后,通过与其他算法进行相关对比实验,进一步验证了该算法的高稳定性和实用价值。  基于暗通道先验的静态手势分割算法。针对“投影仪-摄像机系统”下图像背景和光照条件的特点,提出了基于暗通道先验的静态手势分割算法框架,包括暗通道先验的定义、基于图表示的图像预分割、显著图与分割图的融合等。最后通过自建数据库以及基于此数据库的对比实验,进一步体现了该算法在“投影仪-摄像机系统”环境下的明显优势和高准确率。在该算法中,我们所定义的“暗通道先验”在手势区域的定位上具有十分优异的效果,为未来相关研究提供了一个有益的思路。
其他文献
“海量”、“复杂”为特点的信息时代下,利用计算机进行文本情报分析成为情报分析的重要手段,本文尝试从系统工程的角度清晰化和系统化文本分析系统的构建。  本文将文本分析
在当代社会,科学技术与社会发展呈现一体化进程,随着高技术的崛起及其产业化,科学技术成为第一生产力,科技投入成为第一投入,科技资源成为社会战略性资源和第一资源,科学技术成为国
Petri网作为一种适合于描述和分析那些具有并发、同步和冲突等特征的系统的建模机制,由于其直观的图形表现能力和严密的数学基础,在广泛的领域得到了成功的应用。流体随机Petri
学位
未来社会,移动数据将会呈现爆炸式增长,新应用场景的诞生,各种新型业务需求的出现以及移动设备,物联网设备的层出不穷,第五代移动通信系统就此出现。5G将会如4G一般充斥在生
近年来社交网络服务发展蓬勃,在全球拥有大量用户,社交网站已成为影响力巨大的信息平台。掌握社交网络中用户的行为、特征以及信息传播规律,不仅能够帮助企业根据用户行为特征提
早在上个世纪50年代末,美国军方就开始了子午仪卫星定位系统的研究工作。为获得更高的定位精度,满足美国军方及民用的迫切需要,美国海军研究实验室(NRL)在上个世纪60年代末逐
21世纪是以网络为核心的信息时代,网络已经成为信息社会的命脉和全球经济发展的重要基础。Android是最新的手机操作平台,从它推出至今一直是程序员热衷开发的对象。而将Android
学位
计算机视觉是一门研究如何利用计算机实现人类视觉功能的科学,更确切地说,就是指利用照相机和计算机代替人眼,完成对客观三维场景的感知、识别和理解。双目立体视觉是计算机视觉