论文部分内容阅读
摘要:人脸识别是模式识别以及图像处理研究的重要内容和热点之一,也是生物特征识别技术中的一个非常活跃的课题。人脸识别技术具有实时、准确和非接触等优势,因而较容易被用户接受和认可,目前已经在出入管理、门禁考勤等系统中有着广泛的应用。本文主要研究基于Gabor小波变换与协同表示的人脸识别算法,就其中的特征提取等相关问题进行了深入探讨。首先用Gabor小波对人脸图像进行特征提取,由于变换后的特征维数较高,所以要对变换特征进行降维,本文结合协同表示的方法提出了一种新的基于Gabor特征与协同表示的人脸识别算法,实验结果表明该方法对于人脸图像的光照、表情和姿态等变化具备较强鲁棒性,算法运行速度较快。
关键字:Gabor 人脸识别 协同表示
1. 引言
在人类生活中身份验证一直十分重要且被广泛应用,验证手段也是多种多样,密码就是其中最常用的一种,然而由于密码容易遗忘或被盗用,因此真正安全的方式是利用人体生理上的唯一性差别特征如指纹、虹膜和人脸等,如图1-1。即采用生物识别的方式,但是指纹和虹膜识别都属于主动识别的范畴,需要被识别者主动配合采样才能完成其应用具有一定的局限性,相比之下人脸识别则是一种十分自然的验证方式,既可以采用主动方式也可以采用被动方式能被大众广泛接受。尤其是近几年来人脸识别技术已成为国内外学者研究的热点。
人脸识别过程有两个关键环节,特征提取和分类识别,人脸是非刚体、形变大,再加上表情、饰物、毛发、光照、角度等变化的影响,使得人脸模式呈现出很强的非线性特性,且人脸图像是一个高维矢量,如何提取有效特征尤其重要。此外提高识别的关键也在于设计具有良好分类能力的分类器。
图1 身份识别方式
2.特征提取
2.1 小波特征提取
二维Gabor小波变换经常用来表示和分析图像信号,小波变换是通过计算一组Gabor滤波器函数与给定图像信号的卷积来实现的,在信号处理技术领域中,Gabor变换是被公认的信号表示尤其是图像辨
识的最好方法之一。
二维Gabor函数g(x,y)可以表示为
它的傅里叶变换为
式(2)中 是滤波器的频率带宽,即高斯函数的复调制频率,由神经物理学的研究,W=0.5符合人类的视觉系统。以g(x,y)为母小波,则通过对g(x,y) 进行适当尺度扩张和旋转变换,就可得到自相似的一组滤波器,称为Gabor小波。
2.2 基于改进的2DPCA方法的特征降维
一副人脸图像经多个Gabor滤波器得到Gabor特征,由于维数太高,直接使用这些特征,会产生维数危机,因此需要对Gabor特征矩阵进行降维。
2.2.1 2DPCA方法
2DPCA方法的基本思想总结为:用二维数据矩阵直接构建一个协方差矩阵,求出此协方差矩阵特征值和特征向量,并用对应于最大几个特征值的特征向量构建坐标系,然后将每个数据矩阵在这个坐标系上投影,从而得到有效的特征。
2.2.2改进的2DPCA方法
2DPCA方法只基于图像的行或列一个方向上的运算,在提取图像特征时只压缩了一个方向上的图像信息。改进的2DPCA方法的基本思想是同时考虑图像的行和列两个方向上的2DPCA运算。通过行方向2DPCA运算可以使得图像信息被压缩到一组列向量上,消除了图像列之间相关性。再通过一次列方向2DPCA运算,可以把经过行方向运算压缩而得的图像信息压缩到一组行向量上,消除图像行之间的相关性。改进的方法与2DPCA方法相比,同时包含了图像行方向和列方向信息,能够同时利用图像的灰度信息和结构信息,同时图像特征系数大为减少。
3.基于协同表示的人脸识别算法
在人脸识别中,每一类人脸图像均位于m中的子空间,即m维的人脸图像可以用更低维的特征矢量来表示。如果采用第i类训练样本集合Xi来作为该类的字典,则Xi中的原子 (训练样本)将是相关的。假设每类训练样本是足够多,则所有属于第i类的图像完全能由Xi来表示,因此Xi是一个超完备字典。而由于第i类的训练样本间的相关性可知,属于第i类的测试样本y能用字典Xi稀疏地表示。由上分析可知,为了使得降维后字典Xi满足超完备的要求,算法要求训练样本足够多,但是人脸识别却属于典型的小样本问题,一般情况下Xi是非完备的。如果利用Xi来表示y,即使当y属于第i类也会导致较大的表示误差,因此最终导致分类结果的不稳定。最直接的解决方法是利用第i类的更多样本来表示y,但实际应用中却难以实现。
3.1 Gabor小波变换与改进的分块PCA相结合的算法
本算法为 Gabor 小波变换的人脸特征与改进的分块 PCA 相结合,其算法和流程与实验一大体相似,用 MMPCA 对实验一中所用的 MPCA 进行改进。将 Gabor 小波变换与 MMPCA融合的方法在 ORL 和 YALE 库上实验,结果如图 所示。
3.2不同核函数的结果对比
样本类型 线性核函数 多项式核函数 径向基核函数
4 99.9% 99.8% 99.8%
10 97.2% 96.8% 97.4%
18 94.3% 94.5% 95.4%
25 92.2% 93.1% 93.6%
4.结论
研究了一种基于Gabor小波与协同表示相结合的人脸识别算法,并采用了一种改进二维主元分析进行特征降维,该算法充分利用了Gabor小波在特征提取方面的有效性以及在处理小样本问题和泛化能力强的优势。具有较高的识别率。
关键字:Gabor 人脸识别 协同表示
1. 引言
在人类生活中身份验证一直十分重要且被广泛应用,验证手段也是多种多样,密码就是其中最常用的一种,然而由于密码容易遗忘或被盗用,因此真正安全的方式是利用人体生理上的唯一性差别特征如指纹、虹膜和人脸等,如图1-1。即采用生物识别的方式,但是指纹和虹膜识别都属于主动识别的范畴,需要被识别者主动配合采样才能完成其应用具有一定的局限性,相比之下人脸识别则是一种十分自然的验证方式,既可以采用主动方式也可以采用被动方式能被大众广泛接受。尤其是近几年来人脸识别技术已成为国内外学者研究的热点。
人脸识别过程有两个关键环节,特征提取和分类识别,人脸是非刚体、形变大,再加上表情、饰物、毛发、光照、角度等变化的影响,使得人脸模式呈现出很强的非线性特性,且人脸图像是一个高维矢量,如何提取有效特征尤其重要。此外提高识别的关键也在于设计具有良好分类能力的分类器。
图1 身份识别方式
2.特征提取
2.1 小波特征提取
二维Gabor小波变换经常用来表示和分析图像信号,小波变换是通过计算一组Gabor滤波器函数与给定图像信号的卷积来实现的,在信号处理技术领域中,Gabor变换是被公认的信号表示尤其是图像辨
识的最好方法之一。
二维Gabor函数g(x,y)可以表示为
它的傅里叶变换为
式(2)中 是滤波器的频率带宽,即高斯函数的复调制频率,由神经物理学的研究,W=0.5符合人类的视觉系统。以g(x,y)为母小波,则通过对g(x,y) 进行适当尺度扩张和旋转变换,就可得到自相似的一组滤波器,称为Gabor小波。
2.2 基于改进的2DPCA方法的特征降维
一副人脸图像经多个Gabor滤波器得到Gabor特征,由于维数太高,直接使用这些特征,会产生维数危机,因此需要对Gabor特征矩阵进行降维。
2.2.1 2DPCA方法
2DPCA方法的基本思想总结为:用二维数据矩阵直接构建一个协方差矩阵,求出此协方差矩阵特征值和特征向量,并用对应于最大几个特征值的特征向量构建坐标系,然后将每个数据矩阵在这个坐标系上投影,从而得到有效的特征。
2.2.2改进的2DPCA方法
2DPCA方法只基于图像的行或列一个方向上的运算,在提取图像特征时只压缩了一个方向上的图像信息。改进的2DPCA方法的基本思想是同时考虑图像的行和列两个方向上的2DPCA运算。通过行方向2DPCA运算可以使得图像信息被压缩到一组列向量上,消除了图像列之间相关性。再通过一次列方向2DPCA运算,可以把经过行方向运算压缩而得的图像信息压缩到一组行向量上,消除图像行之间的相关性。改进的方法与2DPCA方法相比,同时包含了图像行方向和列方向信息,能够同时利用图像的灰度信息和结构信息,同时图像特征系数大为减少。
3.基于协同表示的人脸识别算法
在人脸识别中,每一类人脸图像均位于m中的子空间,即m维的人脸图像可以用更低维的特征矢量来表示。如果采用第i类训练样本集合Xi来作为该类的字典,则Xi中的原子 (训练样本)将是相关的。假设每类训练样本是足够多,则所有属于第i类的图像完全能由Xi来表示,因此Xi是一个超完备字典。而由于第i类的训练样本间的相关性可知,属于第i类的测试样本y能用字典Xi稀疏地表示。由上分析可知,为了使得降维后字典Xi满足超完备的要求,算法要求训练样本足够多,但是人脸识别却属于典型的小样本问题,一般情况下Xi是非完备的。如果利用Xi来表示y,即使当y属于第i类也会导致较大的表示误差,因此最终导致分类结果的不稳定。最直接的解决方法是利用第i类的更多样本来表示y,但实际应用中却难以实现。
3.1 Gabor小波变换与改进的分块PCA相结合的算法
本算法为 Gabor 小波变换的人脸特征与改进的分块 PCA 相结合,其算法和流程与实验一大体相似,用 MMPCA 对实验一中所用的 MPCA 进行改进。将 Gabor 小波变换与 MMPCA融合的方法在 ORL 和 YALE 库上实验,结果如图 所示。
3.2不同核函数的结果对比
样本类型 线性核函数 多项式核函数 径向基核函数
4 99.9% 99.8% 99.8%
10 97.2% 96.8% 97.4%
18 94.3% 94.5% 95.4%
25 92.2% 93.1% 93.6%
4.结论
研究了一种基于Gabor小波与协同表示相结合的人脸识别算法,并采用了一种改进二维主元分析进行特征降维,该算法充分利用了Gabor小波在特征提取方面的有效性以及在处理小样本问题和泛化能力强的优势。具有较高的识别率。