论文部分内容阅读
基于计算机视觉的手势识别是新一代的人机交互手段,有着重要的理论研究价值和应用前景。本文对手势图像的预处理、特征提取、手势的跟踪与识别进行了研究,并在Microsoft Visual C++ 6.0环境下编程实现了对从摄像头输入的10个常用手势的识别,并以此为基础建立了一个简单的手势交互系统,以验证算法的可行性。实验结果表明,本文方法对目标手势的实时跟踪有较好的鲁棒性,且对手势的识别取得了良好的效果。首先从输入视频流中采集手势图像,经过预处理建立了手势样本库。在手势图像特征提取阶段,根据识别对象是交互手势这一特点,本文采用Hu矩作为待识别手势的特征,利用几何矩不随图像旋转、平移、尺度的变化而变化的特性,较好的解决了特征提取时的旋转、尺度等不确定性问题。在支持向量机(SVM)多分类方面,分析并验证了“一对多”、“一对一”和决策有向无环图等多分类算法应用于手势识别时的性能;并进一步对SVM在手势识别中的参数优化进行了研究和仿真实验,实验结果表明“一对多”径向基核函数的支持向量机算法在手势识别中取得了理想的识别效果。此外,针对一个手势样本同时属于多个类的错分情况,本文提出将基于后验概率的SVM多分类算法应用于手势识别,并对该算法进行了仿真实验。以概率作为手势分类的输出,在一定程度上减少了误判情况的发生,最终测试样本集的识别率为98.9%。在算法应用方面,本文对自定义的10个数字手势的识别进行了仿真实验,并基于VC++6.0平台编写了Word数字录入程序,将手势识别应用于人机交互中,实现了从摄像头输入手势对Word文件的操作。本文的创新点:一是提出将基于Hu矩特征和“一对多”径向基核函数支持向量机相结合的算法应用到手势识别,并对该算法进行了仿真实验,收到理想的识别效果。二是针对一个手势样本同时属于多个类的错分情况,提出将基于后验概率的多类分类算法应用于手势识别,进一步提高了识别率。