论文部分内容阅读
手势因其灵活、方便、信息丰富等特点被广泛应用于人机交互中,在体感游戏、直播等领域,手势识别的应用迎来了新的契机,但目前手势识别中的复杂背景,及手势交叠、遮挡等问题仍限制了手势识别的准确性。针对以上问题,本文对传统的帧差法和肤色检测法进行了改进,完善了基于几何特征和轨迹特征的手势特征提取算法,进而提高了复杂背景下的手势识别率。研究包括手形区域的检测与分割、手势特征提取、基于支持向量机(Support Vector Machine,SVM)的实时识别三个部分:(1)基于帧差法和肤色检测法相融合的手部精确检测与分割。首先,通过引入光照抑制系数对传统的三帧差法进行了改进,弱化了光照对复杂环境下运动物体检测的影响;而后,设计了自适应阈值选取算法,实现了在YCbCr空间中肤色区域的检测。以上两种方法的融合较好的解决了运动过程中由于手的遮挡、形变等因素造成的手形检测不完整的问题。(2)手势多特征融合。首先,将傅里叶描述子、归一化转动惯量、不变矩作为区分不同手形的几何特征;其次,选取手的空间位置变化量作为手势特征,即根据运动轨迹的方向角变化来区分不同类型的手势动作。最后,对提取的几何特征和轨迹特征进行融合,作为最终的手势特征。(3)基于SVM的手势识别。选取对不同规模样本、不同维度均适用,且具有较宽收敛域的RBF核函数和树形分类器构建SVM实时识别系统。利用从样本数据中提取的手势特征向量对系统进行训练,生成分类器模型,并利用该模型实现了对不同类型手势动作的识别。实验过程中,在不同背景下对100个参与者的不同类别手势动作进行了采集,并基于提出的方法对其进行了训练及测试,在复杂背景下不同手势的识别率均在85%以上,相反,在简单背景下的平均正确识别率可达96%,实验结果表明,提出的手势识别算法取得了较好的识别效果。此外,提出的动态手势识别方法可以较好的应用在聋哑人教学、远程控制、军队现代化手语交互等领域。设计的运动区域检测、肤色区域检测等算法对行人检测、人脸识别等其它模式识别问题的解决具有较好借鉴价值。