论文部分内容阅读
在计算机技术得到快速发展的当今社会中,人脸表情识别在各个领域中发挥的作用愈发重要,且逐渐发展为科研领域中极为热门的课题。本文分别从全局特征提取方法中的Gabor小波变换、LBP算子、LPQ算子和局部特征提取方法中的SIFT算子两个角度出发,对于基于静态图像的人脸表情识别算法进行了研究,主要工作如下:(1)研究了基于Gabor变换融合LBP和LPQ的算法在人脸表情识别中的应用。LBP算子和LPQ算子在提取表情图像的局部特征方面表现优秀,但存在只能在单一尺度进行描述的不足。而Gabor小波在方向选择性、尺度选择特性以及对光照变化的鲁棒性方面有着独特的优势。本文将两者的优点相结合,首先对人脸图像提取Gabor特征,然后对每个Gabor卷积图像分别用LBP算子和LPQ算子进行编码,得到更能表征人脸表情信息的LGBP和LGPQ特征,并进行特征融合。为了进一步降低特征的维度并且提高计算效率,采用PCA+LDA方法对融合后的特征进行降维。实验结果表明基于Gabor变换的方法可以有效地提高表情识别的准确率,提升幅度超过20%。(2)研究了改进的词袋模型在人脸表情识别中的应用。由于对整幅表情图像构建的视觉词典缺乏足够高的区分度,本方法对传统的词袋模型做出了改进。通过引入感兴趣区域的思想,把对于人脸表情识别贡献较高的眼部和嘴部两个区域作为表情图像的感兴趣区域。只针对感兴趣区域提取DSIFT特征并构建视觉词典,最后将得到的两个视觉词汇频率直方图线性合并后用于人脸表情识别。研究结果表明,改进后的方法较传统的词袋模型相比,识别率有3%左右的提升。(3)研究了改进的空间金字塔匹配算法在人脸表情识别中的应用。空间金字塔匹配通过加入图像特征的空间结构信息可以有效地改善词袋模型。本方法对两个感兴趣区域应用词袋模型后分别进行空间金字塔匹配,对得到的特征进行合并以得到区分度更高的图像特征。由于空间金字塔匹配后的特征维度较大,分别引入直方图交叉核和基于Relief F的特征降维两种方法对其进行降维。直方图交叉核方法在降低维度的同时,可以将分类精度提高1%左右。基于Relief F的特征降维方法在保持分类精度的同时,使分类时间有超过20%的下降,提高了分类的效率,对大规模处理人脸表情图像有着重要意义。本文分别在JAFFE和Cohn-Kanade+两个人脸表情数据库上对上述提出的算法进行相关验证,以测试算法的泛化性和有效性。实验结果表明所提出的改进算法在这两个表情数据库上都表现出了较好的分类效果,表明泛化性较好。