论文部分内容阅读
人脸表情识别技术在人机交互、数字家庭、人工智能等方面拥有广阔的应用前景和市场价值,因此利用计算机自动识别人脸表情技术因其高实用性在图像处理、模式识别、计算机视觉等领域逐渐成为新的研究趋势。视觉图像特征被公认为是反映人类表情状态最重要的信息之一,因此本文对基于视觉图像特征的人脸表情识别技术进行了深入研究,在消化和借鉴目前国内外研究成果的基础上,首次将分数阶傅里叶变换应用于人脸表情特征的提取,并在此基础上提出了一种二维分数阶傅里叶变换域(2D-FrFT)多阶次特征融合分类算法。主要研究内容可概括为:研究和分析了常用的基于Gabor小波变换的人类表情特征提取算法及其性能,鉴于分数阶傅里叶变换(FrFT)与Gabor小波变换固有的联系,以及在时频分析中更灵活的表示,提出了基于二维分数阶傅里叶变换(2D-FrFT)的人脸表情特征提取算法。通过仿真实验分析了不同表情在2D-FrFT不同阶次下的时频域特征以及识别率,仿真结果表明:2D-FrFT的变换阶次与表情识别率之间存在必然的联系,在若干确定的变换阶次下基于2D-FrFT的人脸表情识别率较优于Gabor小波变换;设计了基于SVM的多层次分类机制,并将其运用于基于2D-FrFT的人脸表情识别系统。该机制通过“倒金字塔”式分类结构进行分层筛选,以减少参与每层分类的类别数,从而将每层分类过程控制在一个类别数较少的范围内。仿真实验结果表明:相对于SVM, FLDA, HMM等经典分类器,基于SVM的多层次分类机制可以及时调整分类层次,有效控制分类过程,减少误判,提高表情识别率;提出了基于2D-FrFT多阶次特征融合的人脸表情识别方法,该方法利用典型相关分析法(Canonical Correlation Analysis, CCA)对两个识别率较高阶次的时频域表情特征进行融合,利用投影后的相关特征矢量组成融合特征,以消除信息冗余和降低表情特征的维数。仿真实验表明:相对于2D-FrFT 48维单阶次特征,采用两个阶次特征进行CCA融合,仅利用36维融合特征即达到75%的平均表情识别率;与传统的串行融合法进行对比,经过CCA融合后的表情特征鉴别性更强,表情平均识别率显著提高;同时由于降低了降维数,系统计算量更低。