论文部分内容阅读
摘 要:人脸识别技术是一种有效的身份識别技术,是模式识别、图像处理等学科的最热门的研究问题之一。本文首先介绍了人脸识别技术的应用;随后对人脸识别技术国内外研究现状作了详细阐述;最后介绍了当前人脸识别技术所存在的主要问题。
关键词:人脸识别;全局特征提取算法;拉普拉斯特征映射;局部保持投影;核方法
1人脸识别技术的应用
在信息化飞速发展的今天,计算机的应用领域越来越广,大大减轻了人类的体力劳动和脑力劳动。在对人的计算机自动身份鉴别系统中,指纹、基因、虹膜等方法都为接触式鉴别手段,需要人为的采样,属侵犯式的识别。因人脸识别的非接触式特性现以成为计算机领域的一个研究热点,在国内外引起很高的重视,取得了一系列的成果。当前的人脸识别技术主要被应用到了以下几个方面:
1.1刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。
1.2证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。
1.3视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。
1.4入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。
1.5表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。
2国内外研究现状
人脸识别可分为以下几个主流方向:
2.1全局特征提取算法
典型的全局特征提取算法有 1991 年 Turk 和 Pentland 提出了K-L变换的“特征脸”方法,也就是主成分分析方法(Principal ComponentAnalysis,简称PCA)。但是,由于该方法是一种非监督的方法,没有考虑到样本类内、类间的差异性,因此识别效果并不十分理想。为了弥补这一缺点,Belhumeur 等人提出了线性鉴别分析(Linear Discriminant Analysis,简称 LDA)方法,该方法采用 Fisher 准则,使得类间散布矩阵与类内散布矩阵的比值最大。但在实际应用中,由于人脸图像的维数远高于训练样本的数目,导致类内散布矩陣奇异,即所谓的“小样本”问题,因此原始的LDA方法在实际应用中可能达不到非常满意的效果。为了解决这个问题,有大量的研究对LDA进行了各种不同的改进。
2.2局部特征提取算法
近年来,最新的研究成果表明,人脸图像很可能位于一个非线性流形上,其中比较典型的流行学习方法有:等距映射(Isomap)、局部线性嵌入(Local Linear Embedding,简称LLE)和拉普拉斯特征映射(Laplacian Eigenmaps)。虽然LLE和Laplacian Eigenmaps 这两种方法都能比较好地揭示人脸数据内部结构,但是由于它们缺乏明晰的投影矩阵,很难直接地获取样本的特征,因此一般都不直接用于人脸识别。为了解决这个难题,He 等人从对拉普拉斯特征映射逼近的角度提出了局部保持投影(Local Preserved Projection,简称LPP)并将其应用于人脸识别。与PCA和LDA方法不同,LPP 在投影时可以保持样本的局部信息,将人脸样本图像投影到一个流形结构上,并且该结构可以反映原始样本图像的本质。但是LPP是一种无监督的特征提取方法,仍存在一些弊端,其所获取的特征空间并未考虑样本的鉴别信息。因此Yu等人在LPP方法的基础上,引入了 Fisher 鉴别准则,提出了一种鉴别局部保持投影(DiscriminantLocal Preserved Projection,简称 DLPP)方法,并成功地应用到了人脸识别领域。
2.3核方法
目前,伴随着统计学理论研究的日益成熟,核函数学习已成为学者们的一个研究热点,在模式识别和机器学习领域受到广泛的关注,产生了大量的基于核函数的学习方法,如支持向量机(SVMs)、核主成分分析方法(KPCA)和核鉴别分析方法(KDA)等。其中由于KDA方法可以获得到原始样本的非线性鉴别分类信息,因此在模式识别的各个领域都得到了广泛的应用。但是KDA方法本身计算复杂度较高,最近Yang在文献中描述了KDA算法的一种简单的特征提取步骤:KPCA+LDA,该框架揭示了KDA算法的本质。
3当前人脸识别技术所存在的主要问题
尽管人脸识别技术有着广阔的应用前景,但是无论是在识别率,还是在防伪性上,都与指纹,视网膜等有着较大的差距,归根结底,影响人脸识别效果的原因主要有以下的几个方面:
3.1人脸图像的获取过程中的不确定性(如光的方向,以及光的强度等)。
3.2人脸模式的多样性(如胡须,眼镜,发型等)。
3.3人脸塑性变形的不确定性(如表情等)。
3.4所涉及的领域知识的综合性(如心理学,医学,模式识别,图像处理,数学等)。
正因为在人脸识别的过程中存在上述的各种各样的问题,因此在实际的检测和识别过程中,当这些因素叠加到一起的时候,情况就变得更加复杂。基于几何特征的识别方法,其存在的主要问题在于,没有形成一个统一的,优秀的特征提取标准。在描述人脸的时候,受到表情,光照,姿态的影响比较大,无法准确地描述人脸特征。尽管如此,基于几何特征的方法在处理人脸表情分析时,仍然是一个最有效的依据。
从某种意义上来说,人脸识别的各种方法,实际上就是在寻找一种人脸的描述方式,但是要找到一种能够不受各种因素影响的描述方式非常地困难,无论是最早使用的几何描述方式以及后来比较常用的代数描述方式,都不可避免地存在各种干扰。我们只能是在以后的研究中,逐渐去完善人脸的描述方式,使之更加有效,更加准确。
参考文献:
[1]XY He,Niyogi P.Locality Preserving Projections[C]. Neural Information Processing System.Vancouver: Mit Press,2003.
[2]Yu WW,Teng XL,Liu CQ. Face recognition using discriminant locality preserving projections. Imageand Vision Computing,2006,24:239-248
[3]曾岳.人脸识别方法研究[D].西安电子科技大学,2011.
[4] 吴娜.基于自动标记特征点的快速人脸识别算法[D].西安电子科技大学,2009.
[5]胡敏敏.人脸识别系统研究与实现[D].南京邮电大学,2011.
(作者单位: 1.武警石家庄士官学校 基础部 信息技术教研室;
2.武警石家庄士官学校 基础部 信息技术教研室;
3.武警石家庄士官学校训练部信息管理中心)
关键词:人脸识别;全局特征提取算法;拉普拉斯特征映射;局部保持投影;核方法
1人脸识别技术的应用
在信息化飞速发展的今天,计算机的应用领域越来越广,大大减轻了人类的体力劳动和脑力劳动。在对人的计算机自动身份鉴别系统中,指纹、基因、虹膜等方法都为接触式鉴别手段,需要人为的采样,属侵犯式的识别。因人脸识别的非接触式特性现以成为计算机领域的一个研究热点,在国内外引起很高的重视,取得了一系列的成果。当前的人脸识别技术主要被应用到了以下几个方面:
1.1刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。
1.2证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。
1.3视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。
1.4入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。
1.5表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。
2国内外研究现状
人脸识别可分为以下几个主流方向:
2.1全局特征提取算法
典型的全局特征提取算法有 1991 年 Turk 和 Pentland 提出了K-L变换的“特征脸”方法,也就是主成分分析方法(Principal ComponentAnalysis,简称PCA)。但是,由于该方法是一种非监督的方法,没有考虑到样本类内、类间的差异性,因此识别效果并不十分理想。为了弥补这一缺点,Belhumeur 等人提出了线性鉴别分析(Linear Discriminant Analysis,简称 LDA)方法,该方法采用 Fisher 准则,使得类间散布矩阵与类内散布矩阵的比值最大。但在实际应用中,由于人脸图像的维数远高于训练样本的数目,导致类内散布矩陣奇异,即所谓的“小样本”问题,因此原始的LDA方法在实际应用中可能达不到非常满意的效果。为了解决这个问题,有大量的研究对LDA进行了各种不同的改进。
2.2局部特征提取算法
近年来,最新的研究成果表明,人脸图像很可能位于一个非线性流形上,其中比较典型的流行学习方法有:等距映射(Isomap)、局部线性嵌入(Local Linear Embedding,简称LLE)和拉普拉斯特征映射(Laplacian Eigenmaps)。虽然LLE和Laplacian Eigenmaps 这两种方法都能比较好地揭示人脸数据内部结构,但是由于它们缺乏明晰的投影矩阵,很难直接地获取样本的特征,因此一般都不直接用于人脸识别。为了解决这个难题,He 等人从对拉普拉斯特征映射逼近的角度提出了局部保持投影(Local Preserved Projection,简称LPP)并将其应用于人脸识别。与PCA和LDA方法不同,LPP 在投影时可以保持样本的局部信息,将人脸样本图像投影到一个流形结构上,并且该结构可以反映原始样本图像的本质。但是LPP是一种无监督的特征提取方法,仍存在一些弊端,其所获取的特征空间并未考虑样本的鉴别信息。因此Yu等人在LPP方法的基础上,引入了 Fisher 鉴别准则,提出了一种鉴别局部保持投影(DiscriminantLocal Preserved Projection,简称 DLPP)方法,并成功地应用到了人脸识别领域。
2.3核方法
目前,伴随着统计学理论研究的日益成熟,核函数学习已成为学者们的一个研究热点,在模式识别和机器学习领域受到广泛的关注,产生了大量的基于核函数的学习方法,如支持向量机(SVMs)、核主成分分析方法(KPCA)和核鉴别分析方法(KDA)等。其中由于KDA方法可以获得到原始样本的非线性鉴别分类信息,因此在模式识别的各个领域都得到了广泛的应用。但是KDA方法本身计算复杂度较高,最近Yang在文献中描述了KDA算法的一种简单的特征提取步骤:KPCA+LDA,该框架揭示了KDA算法的本质。
3当前人脸识别技术所存在的主要问题
尽管人脸识别技术有着广阔的应用前景,但是无论是在识别率,还是在防伪性上,都与指纹,视网膜等有着较大的差距,归根结底,影响人脸识别效果的原因主要有以下的几个方面:
3.1人脸图像的获取过程中的不确定性(如光的方向,以及光的强度等)。
3.2人脸模式的多样性(如胡须,眼镜,发型等)。
3.3人脸塑性变形的不确定性(如表情等)。
3.4所涉及的领域知识的综合性(如心理学,医学,模式识别,图像处理,数学等)。
正因为在人脸识别的过程中存在上述的各种各样的问题,因此在实际的检测和识别过程中,当这些因素叠加到一起的时候,情况就变得更加复杂。基于几何特征的识别方法,其存在的主要问题在于,没有形成一个统一的,优秀的特征提取标准。在描述人脸的时候,受到表情,光照,姿态的影响比较大,无法准确地描述人脸特征。尽管如此,基于几何特征的方法在处理人脸表情分析时,仍然是一个最有效的依据。
从某种意义上来说,人脸识别的各种方法,实际上就是在寻找一种人脸的描述方式,但是要找到一种能够不受各种因素影响的描述方式非常地困难,无论是最早使用的几何描述方式以及后来比较常用的代数描述方式,都不可避免地存在各种干扰。我们只能是在以后的研究中,逐渐去完善人脸的描述方式,使之更加有效,更加准确。
参考文献:
[1]XY He,Niyogi P.Locality Preserving Projections[C]. Neural Information Processing System.Vancouver: Mit Press,2003.
[2]Yu WW,Teng XL,Liu CQ. Face recognition using discriminant locality preserving projections. Imageand Vision Computing,2006,24:239-248
[3]曾岳.人脸识别方法研究[D].西安电子科技大学,2011.
[4] 吴娜.基于自动标记特征点的快速人脸识别算法[D].西安电子科技大学,2009.
[5]胡敏敏.人脸识别系统研究与实现[D].南京邮电大学,2011.
(作者单位: 1.武警石家庄士官学校 基础部 信息技术教研室;
2.武警石家庄士官学校 基础部 信息技术教研室;
3.武警石家庄士官学校训练部信息管理中心)