论文部分内容阅读
基金项目: 2010年江苏省中小企业应用软件工程技术研究开发项目(JH10-42)
摘要:人脸是人最重要的外部特征。人脸识别是一个跨学科的特征识别技术,其研究历史经历了人脸面部特征的人工识别、人机交互的人脸面部特征识别、人脸机器自动识别三个阶段。人脸识别技术是当今研究的一个热点,具有很大的应用前景。本文回顾分析了人脸识别技术近年来的研究和开发现状,对近年来的人脸识别技术的研究方法作了重点分析、阐述和评价,并结合目前研究中遇到的困难及研究方向,提出自己的看法。
关键词:人脸识别;特征提取;常用方法
1 引言
随着社会经济的飞速发展,各行各业对快速有效的身份自动识别、验证方面的要求日趋迫切,由于人具有生物特征的内在属性,具有很强的稳定性和个体差异,人脸是区别人与人差别的最重要的特征。人的生物特征最重要的是人脸。各人各异、不易缺失、无法复制,所以,人脸识别作为一种生物特征的识别技术,是各领域进行身份验证的理想依据,相比传统的指纹、虹膜、DNA检测等识别方法,更加直接、友好、快捷,具有广泛的应用前景,也成为当前模式识别和人工智能领域的一个研究热点,特别是9.11事件以后,这一技术更加引起广泛的关注。
人脸的差异性使得人类可以轻松认识不同的人,但机器对人脸的自动识别涉及到人工智能、模式识别、计算机视觉、图像处理和分析、图像编码、计算机图形学等众多领域,即便是同一张人的脸,在不同情境下(如人的表情变化、光影变化、视角变化等),得到的图像差别也很大,因此人脸自动识别的研究也极具挑战性。
人脸自动识别的研究广义上大致分为以下三个过程。(1)人脸检测:基于不同检测环境,对人脸的存在与否进行定位分析,这个过程通常被称作为人脸提取。 (2)人脸特征:把待检测的人脸信息同数据库中已知的人脸进行比对,以此来确定待测人脸的人脸特征。常用方法有几何特征法、代数特征法、固定特征模板等。 (3)人脸识别:根据检测提取的人脸表征,选择适当的系统设计匹配方法,对待识别的人脸和数据库的已知人脸进行技术比较,以获取相关待测人脸的信息。特别强调的是人脸自动识别存在两个重要的技术层面:其一是人脸表征的检测与定位;其二是人脸特征的提取与选择。也就是首先对输入图像进行处理分析,判断图像中是否有人脸,如有,则作出准确定位,并根据定位得到人脸图像;其次是对定位到的人脸图像进行提取与识别。
:2 人脸识别的常用方法
2.1基于几何特征的识别方法
人脸是由眼睛、鼻子、嘴巴、下巴等元素组成,对这些元素的结构关系的几何描述作为人脸识别的重要特征,将人脸用一组几何特征矢量来表示,这些特征向量具有位置、视点、大小等相对的不变性。这类方法的应用中,一类是基于面部几何特征点的提取方法,例如Kanade[1]用眼角、嘴巴等点之间的距离以及所成的角这些几何矢量作为人脸的特征。Yuille[2]提出用全局人脸模板以抽取人的眼睛、鼻子、嘴巴等几何特征;另一类是基于曲率进行识别的方法,其原理是先根据人脸的轮廓线曲率线建立分类库,再利用相关函数,计算人脸的轮廓线曲率线,再对人脸进行识别分类。基于几何特征的人脸识别方法优点是对内存方面要求不高,识别速度较快,对光照、光影不太敏感等,它的缺点是对人脸特征抽取困难,准确率不高,常适合于粗分类。
2.2基于代数特征的识别方法
这种识别方法,是把人脸图像相关信息数据看成是一个矩阵,通过数学方法来提取图像的代数特征值或特征向量。其中矩阵中的元素代表的是人脸图像像素的原始灰度特征。基于这种特征的人脸识别方法这际上就是在寻找一种交换,使交换后的人脸图像样本不仅在低维空间便于计算,而且容易得到良好的人脸表征。代数特征法从数学意义上讲是将人脸图像作为二维或一维的随机矩阵,通过数学变换将高维特征空间降到低维特征空间,由此在低维空间实现人脸的识别和判断。
代数特征的人脸识别方法目前主要有三种:(1)主成份分析,(2)线性识别分析,(3)独立成份分析。其优点是识别系统具有较好的稳定性,人脸识别系统对于人脸的不同角度和不同表情的识别具有一定的鲁棒性。该方法也存在一定的弊端,例如矩阵数据量十分大,或者说由于人脸图像矩阵处于一个高维空间,因此大多数情况下不能对特征进行直接分类。
2.3神经网络识别方法
近年来,人工神经网络识别在信息处理、模式识别、智能控制及系统建模等领域应用越来越广泛。在人脸识别中也得到较好的应用。利用神经网络进行人脸识别方面的研究最早的是Kohonen[3],其原理是对样本的学习,构造分类器,再对分类器进行训练,最后利用分类器完成仿真分类。它是一种非线性的识别方法,该方法利用神经网络回忆人脸,能比较准确地回忆出人脸特征。神经网络人脸识别主要方法有:多主分量提取算法,自适应主分量神经网络提取算法,组合分类器设计法等,取得了较为理想的识别效果,识别的准确率和代数特征识别法相当,具有较好的识别效果,尤其在编码压缩和信息处理等方面具有较强优势。但缺点是神经网络中的神经元数目多,且训练时间长。
2.4基于隐马尔可夫模型法(HMM)
隐马尔可夫模型(Hidden Markov Model, HMM)是一种统计模型,主要用于描述信号的统计特征。这种识别方法在文字识别领域和语音识别领域的应用非常广泛,在人脸自动识别系统的研究中,近来也十分活跃。HMM主要使用马尔可夫链来模拟信号统计特征的变化,利用参数化的随机过程来标定模式,这一过程中,对参数可进行相对准确的计算。在进行普通的模式识别时,HMM先要定义大量的隐含状态,再形成一个模式,最后通过训练来调整模式的参数,它是一个双重的随机过程。一是马尔可夫链,用来描述状态的转移,这是基本的随机过程;另一个是随机过程描述状态和观测值之间的统计对应关系。在训练过程中通过观察训练数据的概率变化来决定其所属类型。人脸模型可以通过连续HMM状态来关联,来提取人脸的主要特征。识别率较高,目前在人脸识别方面也得到了广泛的应用。
2.5其它方法
上述介绍的是比较常见的人脸识别方法,近年来,人脸识别技术发展迅速,国外又相继推出其它的识别方法。比较典型的有两种:一是小波分析法,因为小波理论的不断成熟,运用该方法研究图像识别也成为一个热点。其原理是采用小波变换特征来描述人脸的主要特征,其优点是由于它和视网膜对图像的响应相类似,在识别中对于光线和角度的干扰有一定的容忍度,对细微的表情变化不敏感,而且还对人脸的局部细节和空间信息有一定的保留,研究成果也非常多,在人脸识别领域具有重要地位。二是SVM[4]识别法,该方法的主要思想是利用模式识别中的最佳分割平面法对模式进行分类识别,该方法在实际应用中取得了比代数特征识别法更高的识别率[5]。
3结论
综上所述,通过比较分析得出,目前常用的几种人脸识别方法,各有其优缺点,人脸识别技术,至今仍然是一个研究的热门课题,许多国内外专家已经取得了很多重要成果。但在实际应用中,由于受各种变化条件的影响,人脸识别系统的具体应用还不尽人意,人脸识别的理论也并不完善,特别是复杂环境中的人脸特征的选择方法较为单一,具体算法的实现也有许多困难。因此,现在许多人倾向于将多种方法进行综合运用,并且结合心理学和生理学的研究成果,立体化地研究人脸自动识别。另外,如何更好地将人脸识别与其他生物特征的识别结合起来以提高人脸的识别率将也是今后一段时间的研究方向。
摘要:人脸是人最重要的外部特征。人脸识别是一个跨学科的特征识别技术,其研究历史经历了人脸面部特征的人工识别、人机交互的人脸面部特征识别、人脸机器自动识别三个阶段。人脸识别技术是当今研究的一个热点,具有很大的应用前景。本文回顾分析了人脸识别技术近年来的研究和开发现状,对近年来的人脸识别技术的研究方法作了重点分析、阐述和评价,并结合目前研究中遇到的困难及研究方向,提出自己的看法。
关键词:人脸识别;特征提取;常用方法
1 引言
随着社会经济的飞速发展,各行各业对快速有效的身份自动识别、验证方面的要求日趋迫切,由于人具有生物特征的内在属性,具有很强的稳定性和个体差异,人脸是区别人与人差别的最重要的特征。人的生物特征最重要的是人脸。各人各异、不易缺失、无法复制,所以,人脸识别作为一种生物特征的识别技术,是各领域进行身份验证的理想依据,相比传统的指纹、虹膜、DNA检测等识别方法,更加直接、友好、快捷,具有广泛的应用前景,也成为当前模式识别和人工智能领域的一个研究热点,特别是9.11事件以后,这一技术更加引起广泛的关注。
人脸的差异性使得人类可以轻松认识不同的人,但机器对人脸的自动识别涉及到人工智能、模式识别、计算机视觉、图像处理和分析、图像编码、计算机图形学等众多领域,即便是同一张人的脸,在不同情境下(如人的表情变化、光影变化、视角变化等),得到的图像差别也很大,因此人脸自动识别的研究也极具挑战性。
人脸自动识别的研究广义上大致分为以下三个过程。(1)人脸检测:基于不同检测环境,对人脸的存在与否进行定位分析,这个过程通常被称作为人脸提取。 (2)人脸特征:把待检测的人脸信息同数据库中已知的人脸进行比对,以此来确定待测人脸的人脸特征。常用方法有几何特征法、代数特征法、固定特征模板等。 (3)人脸识别:根据检测提取的人脸表征,选择适当的系统设计匹配方法,对待识别的人脸和数据库的已知人脸进行技术比较,以获取相关待测人脸的信息。特别强调的是人脸自动识别存在两个重要的技术层面:其一是人脸表征的检测与定位;其二是人脸特征的提取与选择。也就是首先对输入图像进行处理分析,判断图像中是否有人脸,如有,则作出准确定位,并根据定位得到人脸图像;其次是对定位到的人脸图像进行提取与识别。
:2 人脸识别的常用方法
2.1基于几何特征的识别方法
人脸是由眼睛、鼻子、嘴巴、下巴等元素组成,对这些元素的结构关系的几何描述作为人脸识别的重要特征,将人脸用一组几何特征矢量来表示,这些特征向量具有位置、视点、大小等相对的不变性。这类方法的应用中,一类是基于面部几何特征点的提取方法,例如Kanade[1]用眼角、嘴巴等点之间的距离以及所成的角这些几何矢量作为人脸的特征。Yuille[2]提出用全局人脸模板以抽取人的眼睛、鼻子、嘴巴等几何特征;另一类是基于曲率进行识别的方法,其原理是先根据人脸的轮廓线曲率线建立分类库,再利用相关函数,计算人脸的轮廓线曲率线,再对人脸进行识别分类。基于几何特征的人脸识别方法优点是对内存方面要求不高,识别速度较快,对光照、光影不太敏感等,它的缺点是对人脸特征抽取困难,准确率不高,常适合于粗分类。
2.2基于代数特征的识别方法
这种识别方法,是把人脸图像相关信息数据看成是一个矩阵,通过数学方法来提取图像的代数特征值或特征向量。其中矩阵中的元素代表的是人脸图像像素的原始灰度特征。基于这种特征的人脸识别方法这际上就是在寻找一种交换,使交换后的人脸图像样本不仅在低维空间便于计算,而且容易得到良好的人脸表征。代数特征法从数学意义上讲是将人脸图像作为二维或一维的随机矩阵,通过数学变换将高维特征空间降到低维特征空间,由此在低维空间实现人脸的识别和判断。
代数特征的人脸识别方法目前主要有三种:(1)主成份分析,(2)线性识别分析,(3)独立成份分析。其优点是识别系统具有较好的稳定性,人脸识别系统对于人脸的不同角度和不同表情的识别具有一定的鲁棒性。该方法也存在一定的弊端,例如矩阵数据量十分大,或者说由于人脸图像矩阵处于一个高维空间,因此大多数情况下不能对特征进行直接分类。
2.3神经网络识别方法
近年来,人工神经网络识别在信息处理、模式识别、智能控制及系统建模等领域应用越来越广泛。在人脸识别中也得到较好的应用。利用神经网络进行人脸识别方面的研究最早的是Kohonen[3],其原理是对样本的学习,构造分类器,再对分类器进行训练,最后利用分类器完成仿真分类。它是一种非线性的识别方法,该方法利用神经网络回忆人脸,能比较准确地回忆出人脸特征。神经网络人脸识别主要方法有:多主分量提取算法,自适应主分量神经网络提取算法,组合分类器设计法等,取得了较为理想的识别效果,识别的准确率和代数特征识别法相当,具有较好的识别效果,尤其在编码压缩和信息处理等方面具有较强优势。但缺点是神经网络中的神经元数目多,且训练时间长。
2.4基于隐马尔可夫模型法(HMM)
隐马尔可夫模型(Hidden Markov Model, HMM)是一种统计模型,主要用于描述信号的统计特征。这种识别方法在文字识别领域和语音识别领域的应用非常广泛,在人脸自动识别系统的研究中,近来也十分活跃。HMM主要使用马尔可夫链来模拟信号统计特征的变化,利用参数化的随机过程来标定模式,这一过程中,对参数可进行相对准确的计算。在进行普通的模式识别时,HMM先要定义大量的隐含状态,再形成一个模式,最后通过训练来调整模式的参数,它是一个双重的随机过程。一是马尔可夫链,用来描述状态的转移,这是基本的随机过程;另一个是随机过程描述状态和观测值之间的统计对应关系。在训练过程中通过观察训练数据的概率变化来决定其所属类型。人脸模型可以通过连续HMM状态来关联,来提取人脸的主要特征。识别率较高,目前在人脸识别方面也得到了广泛的应用。
2.5其它方法
上述介绍的是比较常见的人脸识别方法,近年来,人脸识别技术发展迅速,国外又相继推出其它的识别方法。比较典型的有两种:一是小波分析法,因为小波理论的不断成熟,运用该方法研究图像识别也成为一个热点。其原理是采用小波变换特征来描述人脸的主要特征,其优点是由于它和视网膜对图像的响应相类似,在识别中对于光线和角度的干扰有一定的容忍度,对细微的表情变化不敏感,而且还对人脸的局部细节和空间信息有一定的保留,研究成果也非常多,在人脸识别领域具有重要地位。二是SVM[4]识别法,该方法的主要思想是利用模式识别中的最佳分割平面法对模式进行分类识别,该方法在实际应用中取得了比代数特征识别法更高的识别率[5]。
3结论
综上所述,通过比较分析得出,目前常用的几种人脸识别方法,各有其优缺点,人脸识别技术,至今仍然是一个研究的热门课题,许多国内外专家已经取得了很多重要成果。但在实际应用中,由于受各种变化条件的影响,人脸识别系统的具体应用还不尽人意,人脸识别的理论也并不完善,特别是复杂环境中的人脸特征的选择方法较为单一,具体算法的实现也有许多困难。因此,现在许多人倾向于将多种方法进行综合运用,并且结合心理学和生理学的研究成果,立体化地研究人脸自动识别。另外,如何更好地将人脸识别与其他生物特征的识别结合起来以提高人脸的识别率将也是今后一段时间的研究方向。