论文部分内容阅读
近年来,人脸表情识别已经在许多领域有了重要的应用,例如游戏互动、辅助医疗、刑事审讯和智能交通等。但在实际应用中,采集到的人脸表情图像往往具有背景复杂的特点,并且模型训练速度过慢,因而导致表情识别率低且鲁棒性差,难以满足实际需求。K-Means算法作为一种聚类算法,能够训练出符合数据集特性且有良好初值的K均值聚类中心数据集合,将此作为卷积神经网络卷积核的初值来提取特征,可以在一定程度上解决卷积核随机初始化问题。本文在卷积神经网络框架下,结合K-Means聚类思想,提出了一种基于卷积神经网络的人脸表情识别算法。论文的主要研究工作如下:1.在表情识别过程中,如果卷积神经网络(Convolutional Neural Network,CNN)存在层数设置不合理、参数过多等方面的问题时,则会使得CNN的表情识别率低。本文在经典卷积神经网络AlexNet结构的基础上进行了改进。首先,对CNN网络结构主要包括卷积层、下采样层的层数设置以及对网络的激活函数、参数优化方法进行调整,期望提高CNN的非线性表达能力。然后,将卷积神经网络自带的分类器Softmax替换为多分类SVM分类器,期望能够在一定程度上提高模型的分类能力。从模型的性能方面,将新结构算法模型与Alex算法模型进行了仿真实验对比。与此同时,将新结构算法模型和搭载不同分类器的卷积神经网络模型的算法进行了仿真实验对比。仿真实验结果显示,和改进前的AlexNet结构进行对比,改进后的结构能够在一定程度上提高表情识别率。在模型鲁棒性方面,该结构和其它卷积神经网络结构相比也有一定的优势。2.针对卷积神经网络模型训练速度过慢以及在复杂背景下人脸表情识别率不高的问题,引入了K-Means聚类思想,提出了一种基于K-Means聚类思想和CNN相结合的人脸表情识别算法。首先,将本文所提出的新的卷积神经网络结构作为整体框架。其次,通过理论推导和实验分析,设计优化的K-Means模型并应用于卷积神经网络的卷积层中,从而得到具有初值的卷积核以此来提取训练集和测试集中的表情图像特征。仿真实验表明,本文的算法在一定程度上增加了模型的特征提取能力,并且减少了模型的训练时间。