论文部分内容阅读
随着人工智能时代的到来,智能化的人机交互成为一项重要课题,而其中情感计算必不可少。情感计算的研究包含人脸表情识别、语音识别和人体行为姿势识别三个方面。作为情感计算和人机交互领域的重要组成部分,人脸表情识别已然成为模式识别领域中一个具有挑战性的课题,吸引了越来越多的科研工作者投身于该领域的研究。本文通过对现有表情识别相关文献的阅读和总结,针对传统方法的不足,以静态的人脸表情图像作为研究对象,提出了一种基于混合特征的人脸表情识别算法。论文的主要工作如下:(1)首先对原始图像进行预处理,灰度化,直方图均衡化,人脸检测,尺度归一化人脸特征点定位等,同时为了验证算法的可靠性,自行建立了一个以10个人为模型的表情库。(2)针对传统的人脸特征点定位方法,如主动形状模型(ASM),有对图像噪声敏感,因初始化特征点位置不理想而易陷入局部极小值等问题,本文采用一种集成回归树(Ensemble of Regression Trees)的方法完成人脸特征点定位。通过梯度提升树方法将大量的简单回归树组合成强回归器,并通过迭代完成人脸特征点准确定位。实验表明,与ASM相比,使用该方法完成人脸特征点定位后提取几何特征的识别率更高。(3)在Gabor特征提取方面,针对传统特征提取上的不足,本文在特征点定位基础上,划分人脸眼睛、鼻子、嘴三大区域,去除多余信息,选取最接近视觉细胞感受野特性的Gabor滤波器参数提取特征,较传统的Gabor特征识别率更高。在LBP特征提取方面,选取均匀LBP模式,并进行分块提取直方图特征,保证了局部和整体信息的均衡。在几何特征提取方面,本文提出一种联合几何特征,在特征点定位的基础上,提取距离特征和形变特征,并构成联合几何特征,较传统的几何特征,识别率更高。(4)本文提出一种基于三种特征混合的人脸表情识别方法,首先使用集成回归树模型完成人脸特征点定位,提取联合几何特征;划分眼睛、鼻子、嘴重要区域,提取优化Gabor特征;以直方图形式提取LBP特征,再分别用这三种特征训练三个支持向量机(SVM)分类器,然后以本文提出的加权投票法对三个分类器的结果进行综合决策,得到最终识别结果。实验结果表明,较之单一的特征,该算法具有更高的识别率和鲁棒性且充分发挥了不同特征的优点和特性。