论文部分内容阅读
特征提取是模式识别的一个基本问题,提取有效特征对人脸识别起着关键的作用。在众多的特征提取算法中,基于子空间算法由于计算量小、识别性能较好而成为人脸识别中的主流算法。主成分分析和线性判别分析算法开创了子空间算法的研究,并且取得了很大的成功。但是有研究表明人脸图像其实是存在于一个非线性流形结构中,因此基于欧氏空间的主成分分析和线性判别分析无法揭示人脸图像的非线性流形结构,即所提取的特征对分类并不是最优的。局部保持投影算法是流形学习算法拉普拉斯特征映射的线性逼近,因此它能挖掘人脸图像的流形结构。本文基于局部保持投影算法,从统计学、非线性特征提取、二维图像特征提取和小样本问题等角度出发,对保局算法进行了深入研究。具体的研究内容包括:1、针对保局算法是一种非监督学习算法,即未充分利用样本的类别信息,并且提取的特征存在冗余等问题,提出了无关性判别保局算法。原始的保局算法只考虑了数据的局部性,没有考虑样本的类别信息,也没有考虑所提特征之间是否存在相关性。现有的改进算法虽然考虑了类别信息,但是大部分没有考虑样本的类间信息。无关性判别保局算法在继承保局算法的保持局部性的同时,考虑了样本的类别信息,并且外加无关性条件,使得所提特征之间相互无关,这样降低了数据冗余,这两方面保证了所提取的特征具有更强的判别能力。2、针对保局算法本质上是一种线性算法,提出了核正交判别保局差异最大分析。保局算法只考虑了样本的局部性,未考虑样本之间的差异性,并且算法在本质上是一种线性算法,所得到的特征也未正交。为了解决这些问题,所提出的算法先通过核函数将原始样本映射到高维空间中,使得样本在高维空间中线性可分,然后在该空间中分别考虑样本的局部性和差异性,外加正交性条件的限制,使得所提取的特征能处理非线性样本,而正交性条件更有利于样本重构,因此提高了算法的识别性能。3、针对保局算法是基于一维向量的,即需要先把二维图像矩阵转换为一维向量,然后进行特征提取,提出了基于酉子空间的二维判别保局算法。保局算法在把图像矩阵转换为一维向量的过程中,破坏了图像的像素结构,并且会产生小样本问题,不利于模式分类。所提算法在保局算法的基础上,增加了类别信息,并且直接利用图像矩阵分别在水平方向和垂直方向上求解转换矩阵,然后在酉空间内构建一个复矩阵,最后运用线性判别分析得到最优特征。该过程一方面避免小样本问题,另一方面保留了图像像素之间的结构,因此更有利于分类。4、由于在人脸识别中,样本的维数远远大于样本数,因此小样本问题是子空间算法中普遍存在的问题。为了更好地挖掘人脸的低维流形和解决小样本问题,提出了零空间保局判别本征脸和适合于小样本情况下的监督化拉普拉斯判别分析。前者充分考虑了个体类内差别和个体类间差别,结合流形学习思想并借助于判别准则使得投影后个体类内之间保持一定的相似性而个体类间之间的区分度有所增加。通过在个体类内保局差异散度矩阵的零空间中求解最优特征向量,避免了矩阵的奇异性问题,解决了小样本问题。而监督化拉普拉斯判别分析的目标是最小化类内拉普拉斯散度的同时最大化类间拉普拉斯散度,为处理小样本问题,算法先丢弃总体拉普拉斯散度矩阵的零空间,并将类内拉普拉斯散度矩阵投影到总体拉普拉斯散度矩阵的主空间中,然后在该空间中进行特征问题的求解。这样算法只在一个较小矩阵上进行操作,减小了计算量:更为重要的是避免了小样本问题,而且没有信息损失,因此算法提高了效率和识别率。最后,对论文工作进行总结,并提出了下一步的研究方向。