论文部分内容阅读
近几十年来,人机交互与计算机视觉一直是计算机研究的一个重要领域,计算机与人之间的直接通信是人们关注的问题。人们对改善和发展人与计算机的交互作用进行了大量的研究。促进计算机与人类交互作用增强和发展的一个重要因素是研究计算机对人类面部表情的识别能力。在人们进行日常交流时,面部表情起着重要的作用。近几年来,深度学习在图像识别方面取得了重大的进展,但是深度学习在训练数据集时,所用时间过长,而且在数据集的数量较少时,容易陷入过拟合。由于目前比较流行的人脸表情数据集的图片数量比较少,所以本文提出了一系列网络框架来克服深度学习在进行表情识别时所存在缺点,现将本文的工作内容总结如下:1.针对单通道卷积神经网络模型在进行图像处理时,最后得到的特征图尺寸单一,导致网络不能得到图片更多特征信息的缺点,提出了双通道卷积神经网络模型。该模型具有两个并行的子通道,每个通道都是由一个卷积神经网络组成,这样,网络在最后就可以获得两种不同尺寸的特征图,有利于网络获得图片更多的信息。2.在全连接层把Maxout激活函数和Dropout结合使用,使得网络的抗过拟合能力变得更强。3.提出了影响因子α。双通道卷积神经网络具有两个通道,但是在反向传播时,每个通道受到全连接层的影响不同,所以要将全连接层的反向传播误差分配给两个通道,影响因子α可以用来调节分配的比重,提高网络性能。4.提出了基于ASM(Active Shape Model)算法的CNN(Convolutional Neural Network)表情识别算法。在这个算法中,首先利用ASM算法在人脸上标记出68个特征点,然后利用这些特征点的坐标信息对图片中的人脸进行剪切,最后将剪切出来的人脸图片送入双通道卷积神经网络中进行表情识别。该算法不仅进一步提高了表情识别的准确率,而且使得网络收敛速度进一步加快。把本文提出的算法在JAFFE、CK+和Fer2013数据集上进行识别和判断,并且与ResNet和VGG-16进行对比实验,结果表明,本文提出的算法与其它两种模型相比,识别准确率高,收敛速度较快,抗过拟合能力强,验证了本文方法的有效性。