论文部分内容阅读
随着人机交互技术(HCI)的普及及兴起,动态手势识别技术越来越受到研究人员的重视,并逐渐成为人机交互领域的一项重要技术。研究动态手势识别技术,不仅在理论研究中占据重要地位,而且在实践应用中也具有极高价值。动态手势识别技术主要由图像预处理及分割、手形特征提取及学习、轨迹特征提取、动态时间归整法(DTW,Dynamic Time Warping)训练与识别四部分组成。在手势分割中,基于肤色的分割方法在相对简单的背景下有着很好的分割效果,然而当背景变得复杂时,特别是图像背景中存在类肤色区域时,该分割方法就会无法正确追踪手部位置,从而导致分割效果不尽人意。因此,本文引入了一种质心定位的方法,该方法通过对手部质心的位置进行预估判断,从而较好地解决手部区域在运动过程中的有效跟踪问题。在动态手势轨迹跟踪过程中,由于手势背景比较复杂且手的质心受手形影响较大,基于质心估计的轨迹跟踪方法会出现不稳定现象。针对此问题,本文引入了基于光流法的轨迹跟踪方法。光流法不需要完全提取手部区域,且跟踪信息只取决于相邻两帧手势图像的相对运动,具有不受复杂背景影响的优点。在动态手势识别过程中,原有DTW算法虽然训练简单,但却存在计算量大的缺陷。本文通过有效地控制两组时间序列数据匹配范围及匹配失真度对该算法进行了优化。本文主要创新点如下:(1)本文引入了一种基于质心定位的手势分割方法。在复杂背景下,现存手势分割方法的效果不尽人意,而本文引入的分割方法充分利用了手势的运动特性,该方法先采用肤色分割提取手部及脸部区域,并基于手部质心及其他区域(脸部)质心的运动特性,将手部分割出来。这种分割方法简单高效,实验效果更好。(2)本文引入了跟踪效果更佳的迭代LK(Lucas-Kanade)金字塔光流跟踪算法。该跟踪算法通过手部关键位置的运动变化来分析整个手势的运动轨迹,解决了原有质心跟踪方法所存在的缺陷。在质心跟踪方法中,质心位置易受相似肤色目标及手形变化的影响,而本文引入的光流法受背景影响较小,并且分析的图像内容也会减少,从而在不影响实时性的情况下使跟踪准确度得到一定的提高。(3)本文对经典DTW算法进行了优化。该优化算法通过严格地控制两组手势特征向量序列的匹配区域及匹配相似性阈值,不仅减少了经典DTW算法的运算复杂度及存储空间,而且提高了该算法的执行效率,从而增强该算法的实时性。实验结果表明,在融合光流法及优化的DTW匹配算法之后,动态手势的识别准确率有了一定的提高,识别速度也取得了令人满意的效果。