论文部分内容阅读
面部表情识别是计算机科学与人机交互领域的一个新兴研究课题。面部表情是人们内心情感的真实表露。美国著名心理学家阿尔培特认为,在人们进行感情表达时,往往言词的使用只占7%,声调占38%,而剩下的55%由面部表情来完成[1]。人脸表情识别的目的是让人工智能产品能够识别出人的表情,进而分析人的内心情感。人脸表情识别对人机交互、安全、机器人、通信和汽车领域都起着不可估量的作用;因此,对于人脸表情识别的研究具有非常重要的研究和应用价值。表情识别主要分为两大类:动态视频的表情识别和静态图像的表情识别。本人针对静态图像的表情识别做了如下工作:1.研究并实现了基于模板匹配方法的人脸检测,包括制作人脸模板,选择匹配算法及采用马赛克检验方法检测人脸;在表情识别中,成功检测人脸是表情识别的首要任务。2.研究并实现了表情图像的预处理算法,由于各种图像尺寸不同,背景不同,并会有多种光照条件的影响,因此,首先采用直方图均衡化等方法对图像进行预处理。预处理为提高表情识别率奠定了良好的基础。3.实现基于轴对称性的人眼和嘴巴的定位方法,假设单眼区域和嘴巴区域均具有关于中心垂线轴对称的特性,首先找到一只单眼的下半部分区域,迭代选择候选眼睛中心,再利用轴对称性确定整只眼睛的区域,同理可确定另一只眼睛区域及嘴巴区域。在表情识别中,能否准确定位眼睛和嘴巴直接影响到特征值的提取和识别率。4.分别针对高兴、厌恶、悲伤、生气、惊奇、害怕和中性七种表情建立隐马尔可夫模型。在表情识别过程中,由于数据量大、计算复杂度高,会直接影响系统的反应速度和识别率;K-L变换可以把数据从高维空间映射到低维空间,提取出原始数据中的主要特征;因此,本文对特征区域信息进行K-L变换,提取主要特征向量,减小数据计算量及计算复杂度;并将特征向量输入到隐马尔可夫模型中,通过多次跌倒叠代,训练出相应的、稳定的表情模型;在识别过程中通过计算给定图像与训练好的模型的相似度,确定相似度高的模型所代表的表情即为给定图像的表情。系统在测试过程阶段,表现出良好的性能:以JAFFE和索尼(中国)研究院人脸表情数据库为实验数据集,采用模板匹配和马赛克检验方法进行人脸检测,其检测正确率可达到96%;采用K-L变换预处理图像,降低了眼、嘴特征向量的维度,其降维比例可达到65536:3或者65536:6,且信息损失的均方差不超过15%;采用隐马尔可夫模型进行表情识别,针对同一对象进行表情识别,其准确率可达87.55%,针对不同对象进行表情识别,其准确率可达到76.95%。