论文部分内容阅读
人脸表情识别技术涉及到人机交互、情感认知、计算机视觉等多个应用领域,近些年来成为了一个热点研究课题。现存的一些机器学习算法,如支持向量机、核回归、包含一个隐层的人工神经网络等等,都为浅层结构。心理学研究表明,浅层结构在训练集较小,或者是计算单元数量不足的情况下,很难有效地表示出较为复杂的函数。深度学习算法模拟人脑多层抽象的机制,通过自下而上,从低级到高级逐层抽象的特征学习,从而实现复杂函数的逼近,因此本文使用深度学习算法识别人脸表情。本文的主要工作如下:本文对表情识别技术,包括特征提取、分类方法以及深度学习进行了介绍与总结。对深度学习的基本理论、思想进行了介绍,并且详细介绍了深度学习的基本模型及学习算法,其中包括反向传播学习算法、受限玻尔兹曼机、深度信念网络以及卷积神经网络。本文提出了一种基于烟花算法和深度信念网络的人脸表情识别方法。传统的深度信念网络在有监督学习阶段通常使用反向传播策略微调整个网络的初始参数。但是,反向传播法容易陷入局部最优值,不利于深度信念网络找到最优的网络参数。针对该问题,本文提出使用烟花算法(Firework Analysis,FWA)和共轭梯度(Conjugate Gradient,CG)法的融合算法来优化深度信念网络初始参数。首先使用FWA寻找全局最优点,接着使用CG法对全局最优点进行局部搜索,CG算子的使用,明显地提高了 FWA的搜索精度,且大大加快了其收敛速度。实验中,本文采用了两个常用的人脸表情数据库,JAFFE和CK+人脸表情数据库,本文提出的方法在这两个数据库上分别取得了 91.78%和94.48%的识别率,高于现有方法的识别率。本文提出了一种基于线性判别深度信念网络的人脸表情识别方法。传统的深度信念网络最后一个隐层与分类层之间的初始权值矩阵通常随机生成,从而导致经该权值矩阵映射得到的特征不能保证适合于分类任务。传统线性判别分析法存在秩限问题,即对于一个含有C个类别的训练样本,类间离散度矩阵的秩不会超过C-1,这就意味着训练样本经过线性判别分析法映射后的特征维度也不会超过C-1。针对以上两种问题,首先,本文设计了一个新的类间离散度矩阵,得到了一种改进的线性判别分析法,解决了传统线性判别分析法中存在秩限问题;然后,使用改进的线性判别分析法初始化深度信念网络最后一个隐层与分类层之间的权值矩阵,使网络更适合于分类任务。本文提出的线性判别深度信念网络在JAFFE和CK+人脸表情数据库上分别得到了 90.41%和94.48%的识别率。