论文部分内容阅读
近年来,人工智能及其相关学科的发展比较迅速,人们也逐渐感受到了人工智能为生活带来的欢乐与便利,与此同时对人机交互的需求日益增长。人脸表情识别技术的提出将有利于提高人机交互的拟人化程度。研究发现,在某些领域内用卷积神经网络算法提取图像特征比其他传统方法更加有效,所以许多研究者也尝试将卷积神经网络应用于表情识别领域中。但卷积神经网络也存在着一些不可忽视的缺点,浅层卷积神经网络由于层数较少,在样本数量有限的情况下提取图像特征的能力也非常有限,并且样本数据在特征提取过程中也容易受到光照、尺寸、遮挡等外界因素影响。因此本文提出基于改进VGG的卷积神经网络模型以及结合Gabor与卷积神经网络的表情识别算法来解决以上问题。深度卷积神经网络基于一种深层非线性的网络结构,完成图像更深层特征的提取,展现了强大的从图像中学习特征的能力。为了实现通常条件下表情图像的准确分类,提出了基于改进VGG-19卷积神经网络的表情识别模型。由于大多数用于面部表情识别的表情数据库缺乏足够的数据来从头开始训练整个网络,本文采用了迁移学习技术来克服图像数量不足的问题。并通过优化网络结构来适当减少网络参数,防止训练过程中产生过拟合现象。将该方法在CK+表情库上进行人脸表情数据训练和数据分析,表情识别精确率最终达到了96%。然而,深层卷积神经网络的模型过于复杂,会导致训练难度加强。在训练样本数据较少、深层网络模型训练复杂的条件下,要想提高表情识别效果,本质上还要增强提取图像特征的表现力。为了提取图像中更深层次的表情特征,同时根据Gabor能够很好地提取图像中纹理特征的优点,本文提出一种结合Gabor与卷积神经网络的表情识别算法,该算法在图像输入卷积神经网络之前,先提取表情图像的Gabor特征,并将Gabor特征图作为卷积神经网络的输入,能够使该算法提取表情特征的表现力大幅提高。使用该算法得到的最佳表情识别率可以达到99.3%,印证了该方法能够有效地提取表情特征。