基于静态图像人脸表情识别的研究与实现

来源 :西南大学 | 被引量 : 0次 | 上传用户:ytmbg163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机技术得到快速发展的当今社会中,人脸表情识别在各个领域中发挥的作用愈发重要,且逐渐发展为科研领域中极为热门的课题。本文分别从全局特征提取方法中的Gabor小波变换、LBP算子、LPQ算子和局部特征提取方法中的SIFT算子两个角度出发,对于基于静态图像的人脸表情识别算法进行了研究,主要工作如下:(1)研究了基于Gabor变换融合LBP和LPQ的算法在人脸表情识别中的应用。LBP算子和LPQ算子在提取表情图像的局部特征方面表现优秀,但存在只能在单一尺度进行描述的不足。而Gabor小波在方向选择性、尺度选择特性以及对光照变化的鲁棒性方面有着独特的优势。本文将两者的优点相结合,首先对人脸图像提取Gabor特征,然后对每个Gabor卷积图像分别用LBP算子和LPQ算子进行编码,得到更能表征人脸表情信息的LGBP和LGPQ特征,并进行特征融合。为了进一步降低特征的维度并且提高计算效率,采用PCA+LDA方法对融合后的特征进行降维。实验结果表明基于Gabor变换的方法可以有效地提高表情识别的准确率,提升幅度超过20%。(2)研究了改进的词袋模型在人脸表情识别中的应用。由于对整幅表情图像构建的视觉词典缺乏足够高的区分度,本方法对传统的词袋模型做出了改进。通过引入感兴趣区域的思想,把对于人脸表情识别贡献较高的眼部和嘴部两个区域作为表情图像的感兴趣区域。只针对感兴趣区域提取DSIFT特征并构建视觉词典,最后将得到的两个视觉词汇频率直方图线性合并后用于人脸表情识别。研究结果表明,改进后的方法较传统的词袋模型相比,识别率有3%左右的提升。(3)研究了改进的空间金字塔匹配算法在人脸表情识别中的应用。空间金字塔匹配通过加入图像特征的空间结构信息可以有效地改善词袋模型。本方法对两个感兴趣区域应用词袋模型后分别进行空间金字塔匹配,对得到的特征进行合并以得到区分度更高的图像特征。由于空间金字塔匹配后的特征维度较大,分别引入直方图交叉核和基于Relief F的特征降维两种方法对其进行降维。直方图交叉核方法在降低维度的同时,可以将分类精度提高1%左右。基于Relief F的特征降维方法在保持分类精度的同时,使分类时间有超过20%的下降,提高了分类的效率,对大规模处理人脸表情图像有着重要意义。本文分别在JAFFE和Cohn-Kanade+两个人脸表情数据库上对上述提出的算法进行相关验证,以测试算法的泛化性和有效性。实验结果表明所提出的改进算法在这两个表情数据库上都表现出了较好的分类效果,表明泛化性较好。
其他文献
随着高速铁路的发展和人们对宽带无线通信需求的增加,如何为高铁列车旅客提供可靠稳定的宽带无线通信服务,是高速铁路无线通信亟待解决的问题。和典型低速移动环境相比,在高
正交频分复用是一种减轻频率选择性衰落的技术。单载波频分多址利用单载波调制、傅里叶预编码的正交频分复用和频域均衡,能够获得和正交频分多址相似的复杂度和性能,并且由于继
人类的大脑是一个十分复杂的系统,它具有组织神经元进行信息处理的能力,并以比数字计算机更快地速度对信息进行并行以及非线性的处理。一直以来,建立具有人类智慧的机器或自
摘要:视频的应用越来越广泛,如何保证视频质量也是讨论的越来越多的问题。对视频编解码器进行测试是保证视频质量的一个重要方面。然而视频编解码器的测试与通常的软件测试存
目前,针对GSM-R系统这种特殊传播环境的干扰分析,还处在一个相对较初步的阶段。或者说,这种特殊场景下的干扰分析,被大家当作一个特殊情况,还没有引起足够的重视。但是,其他
人类面部表情在人们的日常生活、交流中扮演着十分重要的角色。通常,我们所指的人类面部表情被称之为“宏表情”,其持续时间一般在0.5s~4s之间,容易被人察觉和辨别。然而,有
民用的导航系统由于定位精度有限,无法对复杂的路况信息进行实时的探测;再加上导航系统缺乏针对盲人(视障人士)进行路径搜索与规划的能力,更无法为视障人士的安全出行提供指
摘要:在资源受限的无线多媒体传感器网络中存在大量的图像数据需要处理和传输。在有限条件下,为了充分利用资源,设计能够综合考虑能量消耗、压缩率和图像质量等性能要求的图像
粗糙集理论是20世纪80年代初由波兰数学家Pawlak Z.首先提出的一种新型的处理模糊和不确定知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的
随着信息技术的不断发展,身份验证的快捷性、方便性、经济性显得越来越重要。说话人识别以其独特的优点,在生物识别领域占据着重要的地位。说话人识别的目的是通过对训练语音建