论文部分内容阅读
随着人工智能技术和大数据的发展,机器开始具备像人类大脑一样的学习能力,可以处理庞大的信息数据。人的面部表情存在着大量的信息,人类可以通过对方的表情来了解对方的情感和状态。如今通过智能图像识别的方法,计算机也能实现对表情信息的获取和分析。表情识别可以应用在人机交互、安全、机器人制造、医疗、通信和汽车领域等众多方面,有强烈的市场需求和广阔的发展空间。因此,表情识别的研究以及识别性能的提高具有重要的意义。人工神经网络是仿照生物的神经网络建立起的一种机制,卷积神经网络在人工神经网络基础上发展而来,能够自动提取特征,避免了人工设计提取特征方案对识别效果的影响。本项研究借助深度学习的思想,以深层的VGG卷积神经网络为基础构架,构建了适用于表情识别的深度卷积神经网络模型。在基于深度卷积神经网络的表情识别模型训练过程中,针对网络层数加深导致的梯度消失和梯度爆炸问题,本研究采用LReLU函数作为激活函数,使得梯度稳定更新,并且避免了使用ReL函数出现的神经元被抑制的问题。深层的卷积神经网络有更强学习能力的同时也容易出现过拟合的现象,针对这一问题,本研究采用交叉熵函数作为目标函数,并对目标函数进行L2正则化处理,缓解了过拟合的现象。粒子群(PSO)算法是一种群体智能优化算法,具有易实现、收敛速度快的特点。为提高表情识别准确率和模型的收敛速度,本研究提出用PSO算法优化深度卷积神经网络的初始参数。这种方法不仅可以提高模型训练的收敛速度,还避免了从正态分布取初始参数的随机性。并且PSO算法在进行位置更新时不依赖于梯度,可以避免因初始化方式造成的梯度减小甚至消失问题。PSO算法虽然寻优速度快,但是容易陷入局部最优解。针对PSO算法全局搜索能力差的问题,本研究提出将遗传算法(GA)中的交叉变异方法融合到PSO算法中,用融合后的GA-PSO算法优化深度卷积神经网络的初始参数,使得寻优效果更好,进一步提高了表情识别的准确率。本文采用Fer2013表情数据集和CK+表情数据集分别对上述方法进行了实验与验证。最终本文构建的表情识别模型在Fer2013表情数据集上达到了的71.93%准确率,在CK+表情数据集上达到了的96.7%准确率,并且实验结果表明本文所提出的方法使得模型收敛速度有一定的提升。