论文部分内容阅读
自然场景下的人脸识别面临环境光照、人脸表情、杂乱背景、相机质量、遮挡和年龄等多种因素干扰的问题。本文采用了机器学习领域的深度学习算法,构造出了多种深度卷积神经网络结构进行自然场景下的人脸识别研究。不同于大多数传统算法在自然场景下识别效果锐减的情况,在公开最大的自然场景人脸数据测试集LFW上取得了较好且稳健的识别效果,验证了深度学习在人脸识别领域的价值。本文将深度学习应用于自然场景人脸识别的主要工作内容如下:1、基于卷积神经网络前向传递和随机梯度下降的后向传递算法,设计了深度卷积神经网络结构,训练中引入了mini-batch技术,使得模型能够在CASIAWebFace这样的大型人脸数据库上训练,并在训练阶段,对已有的人脸库做了数据增强和预处理工作。在每个卷积层-池化层模块中引入了级联交叉参数通道池化层结构,构造了更深的卷积神经网络,得到了识别能力更强的神经网络模型。在传统的sigmoid,Relu非线性激活函数上进行改进得到PRelu激活函数。2、在多分支卷积神经网络的基础上,针对自然场景下人脸图像具有更多干扰的问题,设计了最大特征输出层结构;在单一卷积-池化型模块的输出维度不变的情况下,在模块中的隐藏层增加了卷积层通道宽度。在自然场景测试数据库中,该算法的识别效果得到了提升,同时提高了模型稳健程度。3、针对自然场景下个体类别数很大的情况,对传统的Softmax损失代价函数做出改进,增加了关于全连接层特征输出的类内和类间距离度量学习,利用梯度下降学习的特点,设计了类中心的更新方法,并在不同层次的全连接层融合度量学习方法。在深度学习数据驱动的基础上,从自然场景下的数据分布结合深度学习的训练方式入手,进一步改进了类内和类间度量学习,提升了模型识别效果。