论文部分内容阅读
人脸表情识别是在计算机视觉、人工智能和模式识别等前沿领域中非常活跃的研究课题,在智能人机交互和智能家居等领域中具有极其广泛的应用前景。在现实生活中的医疗和信息安全等方面,人脸表情识别也有着许多重要的实际应用。正因为该方向具有十分重要的理论意义和市场价值,越来越多的学者们加入到人脸表情识别技术的研究工作中来。人脸表情识别系统大体可分为三个阶段:人脸检测和图像预处理、特征提取和分类。随着人脸表情识别技术研究的不断深入,特征提取方面的一些难题也不断凸显出来,比如说特征提取算法的鲁棒性、实时性以及稳定性。本文分别研究基于几何特征和基于纹理特征的传统特征提取算法,重点分析了基于纹理特征提取算法的优势与不足,针对传统算法的局限性来提出改进算法。论文的主要工作和贡献如下:(1)通过对表情识别系统中纹理特征提取方法的研究,发现已有的一些特征提取算法的不足,提出了一种多尺度中心误差补偿二值模式(Center Error Compensation Binary Pattern, CECBP)的表情识别算法。首先对预处理后的人脸表情图像创建多尺度金字塔;然后使用中心误差补偿二值模式算子对金字塔中的各层图像进行编码;最后将编码后的各层直方图序列分块提取并作为特征,用支持向量机对CECBP特征进行分类。在JAFFE、Cohn-Kanade以及Pain Expression表情库上的交叉验证表明:该方法具有较高的识别率和较快的识别速度,在抑制噪声方面也有很好的效果,比传统的Gabor小波以及LBP更具有优势。(2)深入研究人脸表情识别技术,为了进一步提高表情识别率和系统鲁棒性,在CECBP算法基础上引入图像显著区域和梯度方向直方图(Histogram of Oriented Gradient, HOG)特征,提出基于显著区域特征决策算法。该算法首先根据面部不同区域的信息丰富程度,利用信息熵来定位图像显著区域;再对这些区域分别提取CECBP特征,对整个显著区域提取HOG特征;最后将这些特征送到SVM分类器中,根据各分类器的不同权值和决策机制来确定最终的识别结果。通过在JAFFE、Cohn-Kanade以及Pain Expression表情数据库的交叉实验,证明了该方法充分利用了面部显著区域的丰富表情信息,不仅继承了CECBP抗噪声与有效提取纹理信息等优势,还解决单一特征的局限性,进一步提高了系统的识别率和有效性。