论文部分内容阅读
面部表情是交流过程中的微妙信号,理解面部表情是理解沟通中的重要部分。随着人工智能的兴起,面部表情识别逐渐备受关注。传统的面部表情识别方法特别容易受到光照、噪声等环境因素的影响,导致表情的识别很不稳定。本文提出的面部表情识别方法是基于深度学习中的卷积神经网络,通过优化识别方案和改进卷积神经网络,不仅提高了表情识别的准确率,还可以稳定的进行面部表情识别,主要研究内容包括以下几点:(1)虽然目前人脸表情数据集很多且各式各样,但是由于大部分数据集的表情都是从某特定角度由摄像机拍摄下来的,因此训练出来的模型存在着一定的不确定性,对随机的新数据泛化能力较弱,鲁棒性很低。本文基于兴趣区域(ROI)思想,对表情数据集做8种处理,重新构建了一套自己的数据集,重视表情图像的细节特征,提高了面部表情识别模型的泛化能力。(2)传统LeNet-5卷积神经网络是进行手写数字识别的,在进行特征提取的时候,没有考虑到低层次的细节特征,这样,如果网络越来越深,容易出现出现梯度消失或爆炸问题。本文提出的基于兴趣区域跨层连接LeNet-5神经网络的人脸表情识别算法,运用跨层连接的方法改进LeNet-5神经网络,将低层网络特征也考虑在内,不仅提高了人脸表情识别的准确率,还加强了训练模型的鲁棒性。(3)生成对抗网络(GAN)因其在生成高质量数据方面的良好表现而受到广泛关注,GAN能够从训练数据中生成模拟真实样本分布的合成样本,特别是GAN已经成功地应用于一些人脸相关的任务中。本文提出了一种新的面部表情合成与识别的联合深度学习方法,进一步提升了人脸表情识别的效果。