论文部分内容阅读
人脸识别是模式识别、计算机视觉等领域中的热点问题之一。几十年来,人脸识别技术已经得到了很大的进步,在处理控制环境下的干净、清晰并良好对齐的正面人脸图像时已经可以取得令人满意的结果。然而,现有的技术在处理质量较差的人脸图像时,比如含有遮挡、低分辨率、非对齐以及姿态等因素的干扰,很难给出良好的性能。本文主要针对上述干扰因素展开稳健人脸识别方法研究,主要的研究成果包括:(1)本文提出了一种基于鉴别性奇异值分解表示学习的人脸识别方法。近年来,基于奇异值分解的表示方法可以有效地消除人脸图像中的遮挡、光照等干扰因素。奇异值分解表示方法揭示了经过奇异值分解后的基集对于人脸识别任务非常重要,而改变奇异值向量则可以产生更有效的表示图像。然而,这些方法往往根据经验性的准则设置奇异值向量,这种方式在理论上并不是最优的。为了解决这个问题,本文构造了一种鉴别性准则学习一组最优的奇异值向量,从而产生更有效的表示图像。实验结果表明,本文提出的奇异值分解表示学习方法优于现有的基于经验的方法。(2)本文提出了一种基于深层递归残差网络的超分辨率及人脸识别方法。现有的人脸识别方法在处理低分辨率人脸图像时性能会急剧下降。因此,有效的人脸超分辨率方法将会显著地提高现有人脸识别方法在低分辨率人脸图像上的性能。近年来,基于卷积神经网络的模型在图像超分辨率任务中取得了非常好的结果。然而,由于采用了非常深层的模型,这些方法往往需要学习大量的参数,对系统的存储空间有很大的要求,限制了这些方法在移动端的应用。为了解决这个问题,本文构造了一种深层但是精简的深层递归残差网络结构。具体而言,全局以及局部残差学习被用来减轻深层网络的训练难度;递归学习被用来控制模型参数量的大小。实验结果表明,本文提出的模型利用少量的参数量即可显著地超越以往的深层学习方法。(3)本文提出了一种基于结构约束编码的非对齐人脸识别方法。以往的非对齐人脸识别方法大多是基于向量模型的稀疏表示方法。这类方法在处理2维图像时需要将图像从矩阵转化成向量,导致一些结构性信息的丢失。为了解决这个问题,本文省去了从2维到1维的转换过程,通过引入一种矩阵回归模型,利用核范数直接刻画图像中的结构误差信息。实验结果表明,与以往的基于稀疏表示的向量模型相比,本文提出的方法在非对齐人脸识别问题中取得了更好的结果。(4)本文提出了一种基于正交普鲁克回归的跨姿态人脸识别方法。以往的线性回归方法对于人脸姿态变化比较敏感。为了解决这个问题,本文将正交普鲁克问题引入回归模型处理2维图像之间的姿态变换。具体而言,正交普鲁克问题寻找两张不同姿态图像之间的最优线性变换,从而消除两张图像之间的姿态差异。为了解决线性变换不适合处理高度非线性得姿态变换的问题,本文又提出一种基于渐进式策略的级联正交普鲁克回归模型。本文提出的方法可以同时处理人脸对齐、姿态矫正以及人脸表示。实验结果显示了本文提出模型的有效性。