论文部分内容阅读
人机交互(Human Computer Interaction,HCI)技术为人与计算机之间信息沟通提供了一个良好便捷的途径,因而成为了目前计算机领域的一个研究热点。基于视觉的手势识别(Hand Gesture Recognition,HGR)作为一种受到广泛关注的技术,在理念和实践上可以很好地应用于人机交互场景。具体而言,基于视觉的手势识别技术指的是通过摄像机等采集设备来获取包含操作手势的视频图像,然后对视频图像进行相应的处理,如手势分割、手势特征提取、手势特征分类、手势跟踪等,从而实现了用户与智能设备之间的信息交互。 手势分割是手势识别算法的初始关键步骤,保证其良好的效果是实现手势准确识别的先决条件。手势分割的方法多种多样,但是站在实践和应用的角度来看,几乎无一例外的,这些方法仍然在准确性、稳定性以及速度上面临着巨大的挑战。在复杂的应用场景下,杂乱的背景和非均匀的光照等都会对手势分割效果带来巨大的影响,另外,手势是一种非刚性物体,其轮廓、角度、大小、位置的多样性也为精准分割带来了困难。 因此,如何在复杂的应用场景下,充分结合有效的目标检测方法以及手势的先验信息,设计高效准确的手势区域分割算法来克服以上问题,是本文所要着力实现的目标。在分析前人研究成果的基础上,本文提出了基于显著性与肤色检测的静态手势分割算法和基于暗通道先验的静态手势分割算法。 基于显著性与肤色检测的静态手势分割算法。针对复杂环境(室内/室外,有/无近肤色背景干扰,不同手型等)下的背景特点,先后使用了基于SLIC的图像预分割、一种像素级的手势区域检测方法、一种区域级的手势区域检测方法、基于贝叶斯框架的多显著图融合等。最后,通过与其他算法进行相关对比实验,进一步验证了该算法的高稳定性和实用价值。 基于暗通道先验的静态手势分割算法。针对“投影仪-摄像机系统”下图像背景和光照条件的特点,提出了基于暗通道先验的静态手势分割算法框架,包括暗通道先验的定义、基于图表示的图像预分割、显著图与分割图的融合等。最后通过自建数据库以及基于此数据库的对比实验,进一步体现了该算法在“投影仪-摄像机系统”环境下的明显优势和高准确率。在该算法中,我们所定义的“暗通道先验”在手势区域的定位上具有十分优异的效果,为未来相关研究提供了一个有益的思路。