论文部分内容阅读
随着科技的发展,以人为中心的人机交互方式成为了时代的必然发展趋势。手势,是日常生活中除了语言以外的另一种交流方式,是表达思想的重要承载物体。到今天,手势更是成为了人机交互的重要媒介,基于计算机视觉的手势识别可以实现非接触性的人机交互,满足时代发展的新需求。本文主要研究了基于计算机视觉的手势识别问题,采用ASL手势库,对手势图像的预处理、特征提取和识别方法等内容展开了研究。本文主要工作内容如下:一、手势图像预处理。这部分内容包含手势图像的二值化、手势图像平滑、手势图像边缘处理以及手势图像形态学处理等方面的内容。进行手势图像的预处理能够使手势识别的效果更好,速度更快,是手势识别中非常重要的内容。在后续的手势识别中,结合不同的特征提取和分类方法,本文也尝试了不同的图像预处理方法,为后续手势识别提供了更有效的支持。二、基于特征提取和支持向量机的手势识别方法。这部分主要关注手势特征提取,主要分析和对比了使用SIFT特征、PCA特征和HOG特征等不同特征进行手势识别。通过PCA、HOG、SIFT等特征提取方法,提取了部分解释性较强的特征,并用这些特征来表征图像,然后通过SVM分类器来进行分类。实验结果表明HOG特征更适用于手势识别,基于HOG特征的手势识别效果相对优于其他两种,识别率最高。三、基于卷积神经网络的手势识别方法。主要引入卷积神经网络,通过深度网络自适应的学习手势特征。论文分析了CNN网络中各个参数对手势识别结果的影响的,并针对网络训练时间长、对样本需求量大等问题,在此基础上使用一个已经训练好的网络来初始化卷积神经网络,使网络的收敛速度加快。在ASL数据集上的实验结果表明。相对于传统的特征提取算法,基于卷积网络的手势识别不但具有较好的鲁棒性,还能获得更好的识别结果。