论文部分内容阅读
卷积神经网络是一个为识别二维形状而特殊设计的多层感知器。一般可用梯度下降法和反向传播算法训练网络。在结构上,卷积神经网络融入了局部感受野、权值共享和下采样三种思想,使其在一定程度上对平移、比例缩放、倾斜或者其它形式的变形具有高度不变性。目前,卷积神经网络已广泛应用于模式识别、图像处理等领域。本文深入研究了人工神经网络和卷积神经网络的理论,并以著名的LeNet-5结构为基础,构建了一些卷积神经网络模型,做了以下几方面研究:(1)鉴于人脸对齐对人脸识别的重要性,而人脸对齐又依赖于眼睛定位,本文设计出了一种级联的卷积神经网络结构,在无约束环境下检测人眼,并与其它方法比较,结果表明级联卷积神经网络的检测性能优于其它方法;(2)在Yale B人脸库、PUT人脸库和AR人脸库上研究了三个由简单到复杂的卷积神经网络模型。首先分别在三个人脸库上以不同的激励函数和不同的下采样方式组合,分析不同组合配置在三个网络上的识别能力;其次从三方面分别改进网络的性能,一是在代价函数中加入权值衰减项,二是在网络中加入dropout技术,三是在权值更新公式中加入动量项;最后,将这三项一起加入网络中,比较分析加入三项的网络与未加入三项的网络的性能,并去掉卷积神经网络的输出层,将全连接层送入SVM分类器,同样比较分析加三项与未加三项的网络提取的特征的有效性,都得出加三项的网络的性能优于未加的。(3)将二维Gabor滤波器加入卷积神经网络结构中,分别以5个尺度构造卷积神经网络(GCNN),比较分析每个尺度下直接用GCNN分类、先用GCNN提取特征再用SVM分类及提取Gabor特征用PCA降维和SVM分类的结果。此外,联合5个尺度的GCNN构成多栏GCNN,与PCA+SVM方法比较,并研究了特征维数变化对两者带来的影响,实验结果显示多栏GCNN优于PCA+SVM方法,特别是在特征维数较低时更明显。