论文部分内容阅读
得益于独特的物理属性和非接触、非侵占性,人脸识别技术已经成为了最重要的身份识别技术之一,在众多领域都得到了广泛的应用。在人脸识别算法中,如何提取高质量的人脸特征是决定算法性能的关键所在。在深度学习技术兴起之前,主流的人脸识别算法主要依靠专家精心设计的手工特征进行特征提取。手工特征一般针对某些特定场景或需求设计,依赖于这些领域的先验知识,开发成本高昂且应用场景受限。深度学习技术是机器学习领域的热门领域,它旨在通过多层级联的复杂非线性结构直接从样本中学习潜在的模式和表征,从而打破手工特征的限制并实现自动特征提取。近年来,作为深度学习技术的代表之一,卷积神经网络(Convolution Neural Network,CNN)已经成为人脸识别领域的研究热点。随着卷积神经网络模型的深度和性能不断增加,其训练过程中的计算量也在不断增大,以至于大部分高性能模型的训练都依赖于昂贵的专用设备。所以,如何在保持模型性能的情况下实现模型的轻量化和小型化是基于深度学习的人脸识别算法进一步发展和应用的关键。本文以基于深度学习的人脸识别算法为主要研究对象,认真研究它们的算法思想和缺点,分析其缺陷并提出改进算法,从而提高算法的性能和鲁棒性。本文的研究工作主要包括以下几点:(1)主成分分析网络(Principal Component Analysis Network,PCANet)是一种轻量级深度学习模型,它利用主成分分析算法而非反向传播算法来训练模型,从而极大地缩短了模型训练的时间。此外,一个典型的PCANet模型仅包含两层卷积层、一层二值化哈希层和一层直方图统计层,从模型的网络结构上减少了计算量。但是PCANet使用基于二范数的主成分分析算法,对样本中存在的异常值和噪声不鲁棒。L1-PCA是一种简单高效的基于一范数的主成分分析算法,对于样本中存在的异常值较为鲁棒。本文通过向PCANet中引入L1-PCA算法,从而构建出基于一范数的主成分分析网络(L1-norm-based Principal Component Analysis Network,L1-PCANet)。此外,我们还将二维双向策略引入L1-PCA,推导得出L1-2DPCA,并将其引入PCANet,从而构建出基于一范数的二维双向主成分分析网络(L1-norm-based two-directional two-dimensional Principal Component Analysis Network,L1-2D~2PCANet)。我们在多个经典的人脸数据集上进行了大量的实验,实验结果表明本文提出的算法能够有效地提升模型性能,同时对于带有异常值和噪声的样本更加鲁棒。(2)目前想要评估某个卷积神经网络模型的性能只能将某个测试集全部输入到网络中并观察输出的情况。这样一来,评估的效果依赖于测试集的选取,如果测试集包含较为全面的样本,那么评估的结果就比较全面;如果测试集包含的样本不全面,那么评估的结果就比较差。此外,当样本集数量过多时,性能评估会花费较多的时间,特别是在模型训练时,每隔一定的训练批次就需要对模型进行一次性能评估。奇异向量典型相关分析(Singular Vector Canonical Correlation Analysis,SVCCA)是一种用于度量任意两组神经元之间的相似程度的方法,根据结构决定功能的思想,卷积神经网络的结构在一定程度上也决定了其性能。在本文中,我们提出了一种基于奇异向量典型相关分析的卷积神经网络性能评估新方法,该方法通过奇异向量典型相关分析度量性能已知的卷积神经网络和性能未知的卷积神经网络之间的相似性,并根据该相似性做加权平均,得到对未知卷积神经网络性能的评估值。我们在多个经典的数据集上进行了大量实验,实验结果表明,相比于传统的评估方法,本文所提出的方法在具有5%左右的评估误差时可以提升5倍的评估速度。(3)PCANet在训练时只需要将全部的样本处理成一个样本矩阵,并进行一次PCA操作即可完成训练,当得到新样本时,PCANet只能重新训练。另外,当训练样本过多时,样本矩阵会超出硬件的限制,使得训练无法进行,所以PCANet无法在大数据集下进行训练。级联协方差无关增量主成分分析(Candid Covariance-free Incremental Principal Component Analysis,CCIPCA)算法是一种高效的增量主成分分析算法,它每次只使用一张样本迭代地计算样本的协方差,且能够在训练完成之后进行增量训练。本文先将ICCIPCA算法扩展为双向二维增量主成分分析算法(two-directional two-dimensional Incremental Principal Component Analysis,2D~2IPCA),再将其引入PCANet,从而构建出基于双向二维的增量主成分分析网络(Incremental Principal Component Analysis Network,IPCANet)。所提出的网络在训练阶段每次只使用一张样本,从而避免了样本集过大无法训练的情况。我们在多个经典的人脸数据集上进行了大量实验,实验结果表明本文所提出的方法不仅提升了性能,还解决了样本集过大的问题。