论文部分内容阅读
人脸是这样识别的
通常我们所说的人脸识别是基于光学人脸图像的身份识别与验证的简称。光学人脸图像(以下简称人脸图像)是外界光源(包括太阳光、室内人造光源和其他物体表面反射而来的光线)发出的光线照射在人脸上,经人脸表面反射后传播到摄像机传感器的光线强度的度量。不难理解,这一成像过程实际上涉及到三大类关键要素:
1. 人脸内部属性:包括人脸表面的反射属性(如反射系数等,通常简称为纹理[Texture])、人脸3D形状(表面法向量方向)、以及人脸表情、胡须等属性的变化;
2. 外部成像条件:包括光源(位置和强度等)、其他物体(比如眼镜、帽子)或者人体其他部件(比如头发)对人脸的遮挡等;
3. 摄像机成像参数:包括摄像机位置(视点)、摄像机的焦距、光圈、快门速度等内外部参数。
不难理解,在成像过程中,人脸表面3D结构及其反射属性才是人脸相对稳定的本质属性,是人脸识别算法应该赖以区分不同人脸的主要特征;而人脸表情变化、有无胡须等尽管也属于人脸内部属性,但因为具有可变性而不能作为人脸的区分特征。光源等外部成像条件以及摄像机参数等外部因素就更不能作为人脸识别依赖的特征属性。因此,在理想情况下,要根据人脸图像区分不同的人脸,根本上似乎需要从人脸图像表观中分离开人脸稳定不变的本质属性(3D形状与表面反射率)与外界条件和摄像参数。然后,从3D形状与表面反射率属性中提取不同人脸的差异信息,馈入到后端的判别分类器中进行识别。然而,这一过程并不那么简单直接:从单一未知光源条件的图像中恢复3D形状信息和表面反射率是经典的视觉难题,本质上是一个病态的问题,尽管近年来研究人员通过利用各种约束条件和先验知识可以在一定程度上实现该功能,或者要求多幅不同光照条件下的图像以便得到更精确的估计结果,但直到现在仍没有取得本质的突破。除了少数采用特殊设备获取人脸3D结构外,多数系统不得不退而求其次,采用的人脸建模方法仍然停留在图像表观层面上,并没有对3D形状和纹理进行显式分离的步骤,而是直接从图像表观中提取判别特征并进行分类来完成识别。
人脸识别问题是这样产生的
人脸识别技术架构
经过40多年的发展,人脸识别技术已经取得了长足的进步。然而,这并不意味着人脸识别技术已经非常成熟了,恰恰相反,因为更大量的人脸识别应用系统需要在更大规模人脸库、摄像环境不可控、用户不配合的情况下使用,目前最好的识别系统在这样的情况下识别系统正确识别率只能达到75%以下,验证系统等错误率攀升到10%以上。
概括而言,目前人脸识别领域的主要开放问题包括:鲁棒、准确的特征配准问题;对各种图像采集条件变化鲁棒的核心识别算法;识别算法的泛化能力和自适应学习问题;光照变化问题,尤其是室外光照变化;姿态不变的人脸识别算法;人脸信息采集设备带来的问题;低质量照片的检测识别问题;年龄变化导致的照片老化问题;墨镜、帽子、口罩等造成的遮挡问题;化妆、整容带来的问题。另外需要注意的是:上述开放问题大多都是组合性的。
作者简介
山世光,男,博士、副研究员,现任中科院计算所数字媒体研究中心副主任,中科院计算所-银晨科技面像识别联合实验室副主任。1999年获哈尔滨工业大学计算机应用硕士学位,2004年获中科院计算所计算机应用工学博士学位。2004年带领中科院计算所人脸识别研究组获首届中国生物特征识别竞赛(BVC2004)人脸识别测试第一名。2006年带领研究组荣获人脸识别国际竞赛FVC2006第一名。作为主要完成人研制的人脸识别成果获“2005年度国家科技进步奖二等奖”(第3完成人)。主要研究兴趣为人脸识别为主的视觉模式分析与识别、机器学习算法等。
陈熙霖,男,博士、研究员、博士生导师,现任中科院计算所数字媒体研究中心主任。1988年、1991年和1994年分别于哈尔滨工业大学计算机系获得学士、硕士和博士学位。近年来主要研究领域为计算机视觉、模式识别、多媒体技术以及多模式人机接口。先后获得国家科技进步二等奖三项,省部级科技进步奖7项,以及863计划15周年先进个人贡献奖。获得国家发明专利四项,合作出版《计算机视觉》专著一本,在多种国内外刊物和会议上发表论文100多篇。担任过十多个国际学术会议的程序委员会委员。
人脸识别技术是这样发展的
人脸识别是一个被广泛研究着的热门问题,大量的研究论文层出不穷。为了更好地对人脸识别研究的历史和现状进行介绍,我们将按照研究内容、技术方法等方面的特点大体划分为三个时间阶段来作介绍。
第一阶段(1964~1990年)
这一阶段人脸识别通常只是作为一个一般性的模式识别问题被研究,所采用的主要技术方案是基于人脸几何结构特征(Geometric feature based)的方法,这集中体现在人们对于剪影(Profile)的研究上,人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。人工神经网络也一度曾经被研究人员用于人脸识别问题中。较早从事AFR研究的研究人员除了Bledsoe外还有Goldstein,Harmon以及Kanade等。Kanade博士于1973年在京都大学完成了第一篇AFR方面的博士论文,直到现在,作为卡内基-梅隆大学(CMU)机器人研究院的一名教授,Kanade博士仍然是人脸识别领域的活跃人物之一,他所在的研究组也是人脸识别领域的一支重要力量。总体而言,这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。
第二阶段(1991~1997年)
这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可谓硕果累累:不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的FERET人脸识别算法测试,并出现了若干商业化运作的人脸识别系统,比如最为著名的Visionics(现为Identix)的FaceIt系统。
麻省理工学院媒体实验室的Turk和Pentland提出的“Eigenface”方法无疑是这一时期内最负盛名的人脸识别方法。其后的很多人脸识别技术都或多或少与Eigenface有关系,现在Eigenface已经与归一化的协相关量(Normalized Correlation)方法一道成为人脸识别的性能测试基准算法。
这一时期的另一个重要工作是麻省理工学院AI实验室的Brunelli和Poggio于1992年左右做的一个对比实验,他们对比了基于结构特征的方法与基于模板匹配的方法的识别性能,并给出了一个比较确定的结论:模板匹配的方法优于基于特征的方法。这一导向性的结论与Eigenface共同作用,基本中止了纯粹的基于结构特征的人脸识别方法研究,并在很大程度上促进了基于表观(Appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别方法的发展——他们逐渐成为主流的人脸识别技术。
Belhumeur等提出的Fisherface人脸识别方法是这一时期的另一重要成果。该方法首先采用主成分分析(Principal Component Analysis,PCA,亦即Eigenface)对图像表观特征进行降维,在此基础上,采用线性判别分析(Linear Discriminant Analysis, LDA)的方法变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。该方法目前仍然是主流的人脸识别方法之一,产生了很多不同的变种。
MIT的Moghaddam则在Eigenface的基础上,提出了基于双子空间进行贝叶斯概率估计的人脸识别方法。人脸识别中的另一种重要方法——弹性图匹配技术(Elastic Graph Matching,EGM)也是在这一阶段提出的。
由美国国防部反毒品技术发展计划办公室资助的FERET(FacE REcognition technology Test)项目无疑是该阶段内的一个至关重要的事件。FERET项目的目标是要开发能够为安全、情报和执法部门使用的AFR技术。该项目包括三部分内容:资助若干项人脸识别研究、创建FERET人脸图像数据库、组织FERET人脸识别性能评测。该项目分别于1994年、1995年和1996年组织了3次人脸识别评测,几种最知名的人脸识别算法都参加了测试,极大促进了这些算法的改进和实用化。该测试的另一个重要贡献是给出了人脸识别的进一步发展方向:光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方向。
第三阶段(1998年~现在)
FERET’96人脸识别算法评估表明:主流的人脸识别技术对光照、姿态等由于非理想采集条件或者用户不配合造成的变化鲁棒性比较差。因此,光照、姿态问题逐渐成为研究热点。与此同时,人脸识别的商业系统进一步发展,为此,美国军方在FERET测试的基础上分别于2000年和2002年组织了两次商业系统评测。
以支持向量机(Support Vector Machines,SVMs)为代表的统计学习理论也在这一时期内被应用到了人脸识别与确认中来。SVMs是一个两类分类器,而人脸识别则是一个多类问题,通常有三种策略解决这个问题,即:类内差/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。
Blanz和Vetter等提出的基于3D变形(3D Morphable Model)模型的多姿态、多光照条件人脸图像分析与识别方法是这一阶段内一项开创性的工作。该方法在本质上属于基于合成的分析技术,可以使得人脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开,更加有利于人脸图像的分析与识别。实验表明,该方法在CMU-PIE(多姿态、光照和表情)人脸库和FERET多姿态人脸库上都达到了相当高的识别率,证明了该方法的有效性。
Shashua等在2001年提出了一种基于商图像的人脸图像识别与绘制技术。Basri和Jacobs则利用球面谐波(Spherical Harmonics)表示光照、用卷积过程描述朗博反射的方法解析地证明了一个重要的结论:由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。这为光照问题的解决提供了重要思路。
FERET项目之后,涌现了若干人脸识别商业系统,美国国防部有关部门进一步组织了针对人脸识别商业系统的评测——Face Recognition Vendor Test(FRVT),至今已经举办了两次:FRVT2000以及FRVT2002测试。这两次测试一方面对知名的人脸识别系统进行了性能比较,例如FRVT2002测试就表明Cognitec、Identix和Eyematic三个商业产品遥遥领先于其他系统,而它们之间的差别不大。另一方面则全面总结了人脸识别技术发展的现状:较理想条件下(正面签证照),针对37437人121589幅图像的人脸识别(Identification)最高首选识别率为73%,人脸验证(Verification)的等错误率大约为6%。FRVT测试的另一个重要贡献是还进一步指出了目前的人脸识别算法亟待解决的若干问题。
总体而言,目前非理想成像条件下的人脸识别问题逐渐成为研究的热点问题。而非线性建模方法、统计学习理论、基于Boosting的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。
作者简介
高文,男,博士、教授、博士生导师、第十届全国政协委员。1988年获哈尔滨工业大学计算机应用博士学位,1991年获日本东京大学电子学博士学位。近几年的主要研究兴趣包括视频编码与分析、手语识别与合成、人脸识别、数字图书馆等。已出版著作4部,发表科学论文400余篇。曾四次获得国家科技进步二等奖。
行业应用中普及尚需时日
王阳生,博士、博士生导师、研究员。2000年2月受聘于中科院自动化研究所,任研究员、博士生导师、人机交互联合实验室主任、国家863网络游戏战略研究组组长、生物特征认证与测评中心副主任等职。
尽管目前存在着多种识别技术,但由于不同场合有着不同的应用需求,尚没有一种识别技术能适用于所有的应用,因而人脸识别技术就有了其存在和发展的空间。
就像世界上不会出现完全相同的指纹一样,人脸也有着不可替代的惟一性。就连双胞胎你也只能说他们长得相像,而并非完全一样。正是由于这个缘故,人脸完全可以当作每个人的身份证件来使用。相比虹膜和指纹等识别技术,人脸识别技术具有采集方便、识别快速、不易假冒、识别精度高等优势,只需要用一个普通的摄像头就可以进行人脸采集,再经过特征提取、对齐、识别等步骤,系统就可以判断出采集的人脸的身份,可使适用于那些需要身份认证的场所。
在实际的应用中,由于目前的人脸识别方法主要集中在二维图像方面,比较容易受到光线、姿势、表情变化的影响,降低了识别的准确度,所以至今要建立一个鲁棒的人脸识别系统仍然是一件比较困难的事情。除此之外,在人脸识别的理论研究和产业化方面还有大量的工作要做,特别是利用三维信息进行人脸识别的技术,虽然目前面临着数据获取困难、海量存储和计算困难、识别方法不足等问题,但一旦在三维人脸识别上取得进展,将是识别领域中一个新的突破。
可以说,人脸识别技术在日常生活中已经有了一些应用。比如在公安系统帮助公安干警抓捕罪犯,在银行业务中帮助为银行柜台交易提供场景、客户脸部特征及点钞数字等信息可作为日后取证的重要手段等。但在各种需要身份认证的场所大量使用人脸识别技术,目前还有待技术和产品的进一步发展。在未来的3~5年内,我国的人脸识别技术将会进入稳定期,将能更多更快地投入到行业应用中去。 (徐昕)
人脸识别是这样面对挑战的
在我们生存的这个地球上,居住着近65亿人,每个人的面孔都由额头、眉毛、眼睛、鼻子、嘴巴、双颊等少数几个区域组合而成,它们之间的大体位置关系也是固定的,并且每张脸的大小不过七八寸见方,然而,它们居然就形成了那么复杂的模式,从而形成了在这个世界上找不出两张完全相同的人脸的结论。那么,区分如此众多的不同人脸的“特征”到底是什么?能否设计出具有同样的人脸识别能力的自动机器?这种自动机器的人脸识别能力是否能够超越人类自身?对这些问题的分析和解答无疑具有重要的理论和应用价值,这正是众多从事自动人脸识别研究的研究人员所面临的挑战。
然而,对这些问题的回答并不像看起来那么容易,即使在大量来自模式识别、计算机视觉、神经计算、生理学等领域的研究人员对自动人脸识别艰苦工作40余年之后,这些最基本的科学问题仍然困惑着研究人员。退一步讲,即使对我们自己,尽管我们每天都在根据面孔区分着亲人、同学、朋友、同事等,大多数人却很难准确的描述出自己到底是如何区分他们的,甚至描述不出自己熟悉的人有什么具体的特征,即使对专门从事相关的生理学、心理学、神经科学研究的一些专家,也很难描述清楚人类人脸识别的生理学过程。这意味着基于仿生学的人脸识别研究路线在实践上是难以操作的。当然,飞机的翅膀并不需要向鸟儿一样扇动,自动人脸识别的计算模型也未必只能模拟“人脑”。我们也许可以通过建立人脸识别的计算模型,这种计算模型可能是基于仿生神经网络的,也可能是纯粹基于统计的,或者是这二者之外的第三只眼睛,并通过构建实用的自动人脸识别系统来验证这些计算模型,以图回答上述问题。
人脸识别是一项既有科学研究价值,又有广泛应用前景的研究课题,国际上大量研究人员几十年的研究取得了丰硕的研究成果,自动人脸识别技术已经可以在某些限定条件下得到了成功应用。这些成果更加深了我们对于自动人脸识别这个问题的理解,尤其是对其挑战性的认识。尽管在海量人脸数据比对速度甚至精度方面,现有的自动人脸识别系统甚至可能已经超过了人类自身,但对于复杂变化条件下的一般人脸识别问题而言,自动人脸识别系统的鲁棒性和准确度还远不及人类,这种差距产生的本质原因现在还不得而知,毕竟我们对于人类自身的视觉系统的认识还同样肤浅,但从模式识别和计算机视觉等学科的角度,既可能意味着我们尚未找到对面部信息进行合理采样的有效传感器(考虑单目摄像机与人类双眼系统的差别),更可能意味着我们采用了不合适的人脸建模方法(人脸的内部表示问题),还有可能意味着我们并没有认识到自动人脸识别技术所能够达到的极限精度。但无论如何,赋予计算设备与人类似的人脸识别能力是众多该领域研究人员的梦想!相信随着研究的继续深入,我们的认识应该能够更加准确的逼近这些问题正确答案。
笔记本电脑也以貌取人
只要面对屏幕,如照镜子一般简单,设备就能辨识主人,并决定是否接受操作。这种颇有些神似特工的独特体验用到的正是“人脸识别技术”。如今,这项技术已经被应用到面向个人用户的笔记本电脑当中。联想天逸F30、方正S620都是应用这项技术的代表产品。
这类笔记本电脑是通过摄像头来辨认使用者容貌,实现机主信息识别,进而达到数据保护的目的。这项“以貌取人”的认证方式,为用户提供了全新的加密模式,与密码、安全锁以及指纹识别等安全保护措施互为补充,无疑进一步提高了笔记本电脑的安全级别。
据技术人员介绍,此项技术主要是运用了生物智能学科的人脸影像分析和识别技术,利用对人脸结构的五点特征定位,并启动五级安全认证机制来核比人脸数据库而实现的采用人像识别的安全设置。用户要进入windows登陆界面时,电脑就将自动通过内置摄像头对用户进行人像识别,将用户传入人像识别系统,系统对人脸密码进行分析鉴定后,允许合法身份进入电脑。
人像识别技术的另一大功用是,可以实时监视用户状态,在用户离开监视范围预先设置的时间限定之后,电脑将自动锁定计算机。假如有其他人试图进入电脑,人像识别系统则会自动将对方记录下来。
从目前的应用来看,这项技术的应用,但目前人脸识别的主要诉求是验证快捷,因此,在安全级别要求适中的环境中使用非常具有实用性。不仅提高了产品的安全性,更增加了笔记本电脑的娱乐感。因此,这项创新技术在笔记本上的成功应用,这也预示着一种趋势,笔记本厂商正在重新回归对应用的关注。
(刘洪宇)
通常我们所说的人脸识别是基于光学人脸图像的身份识别与验证的简称。光学人脸图像(以下简称人脸图像)是外界光源(包括太阳光、室内人造光源和其他物体表面反射而来的光线)发出的光线照射在人脸上,经人脸表面反射后传播到摄像机传感器的光线强度的度量。不难理解,这一成像过程实际上涉及到三大类关键要素:
1. 人脸内部属性:包括人脸表面的反射属性(如反射系数等,通常简称为纹理[Texture])、人脸3D形状(表面法向量方向)、以及人脸表情、胡须等属性的变化;
2. 外部成像条件:包括光源(位置和强度等)、其他物体(比如眼镜、帽子)或者人体其他部件(比如头发)对人脸的遮挡等;
3. 摄像机成像参数:包括摄像机位置(视点)、摄像机的焦距、光圈、快门速度等内外部参数。
不难理解,在成像过程中,人脸表面3D结构及其反射属性才是人脸相对稳定的本质属性,是人脸识别算法应该赖以区分不同人脸的主要特征;而人脸表情变化、有无胡须等尽管也属于人脸内部属性,但因为具有可变性而不能作为人脸的区分特征。光源等外部成像条件以及摄像机参数等外部因素就更不能作为人脸识别依赖的特征属性。因此,在理想情况下,要根据人脸图像区分不同的人脸,根本上似乎需要从人脸图像表观中分离开人脸稳定不变的本质属性(3D形状与表面反射率)与外界条件和摄像参数。然后,从3D形状与表面反射率属性中提取不同人脸的差异信息,馈入到后端的判别分类器中进行识别。然而,这一过程并不那么简单直接:从单一未知光源条件的图像中恢复3D形状信息和表面反射率是经典的视觉难题,本质上是一个病态的问题,尽管近年来研究人员通过利用各种约束条件和先验知识可以在一定程度上实现该功能,或者要求多幅不同光照条件下的图像以便得到更精确的估计结果,但直到现在仍没有取得本质的突破。除了少数采用特殊设备获取人脸3D结构外,多数系统不得不退而求其次,采用的人脸建模方法仍然停留在图像表观层面上,并没有对3D形状和纹理进行显式分离的步骤,而是直接从图像表观中提取判别特征并进行分类来完成识别。
人脸识别问题是这样产生的
人脸识别技术架构
经过40多年的发展,人脸识别技术已经取得了长足的进步。然而,这并不意味着人脸识别技术已经非常成熟了,恰恰相反,因为更大量的人脸识别应用系统需要在更大规模人脸库、摄像环境不可控、用户不配合的情况下使用,目前最好的识别系统在这样的情况下识别系统正确识别率只能达到75%以下,验证系统等错误率攀升到10%以上。
概括而言,目前人脸识别领域的主要开放问题包括:鲁棒、准确的特征配准问题;对各种图像采集条件变化鲁棒的核心识别算法;识别算法的泛化能力和自适应学习问题;光照变化问题,尤其是室外光照变化;姿态不变的人脸识别算法;人脸信息采集设备带来的问题;低质量照片的检测识别问题;年龄变化导致的照片老化问题;墨镜、帽子、口罩等造成的遮挡问题;化妆、整容带来的问题。另外需要注意的是:上述开放问题大多都是组合性的。
作者简介
山世光,男,博士、副研究员,现任中科院计算所数字媒体研究中心副主任,中科院计算所-银晨科技面像识别联合实验室副主任。1999年获哈尔滨工业大学计算机应用硕士学位,2004年获中科院计算所计算机应用工学博士学位。2004年带领中科院计算所人脸识别研究组获首届中国生物特征识别竞赛(BVC2004)人脸识别测试第一名。2006年带领研究组荣获人脸识别国际竞赛FVC2006第一名。作为主要完成人研制的人脸识别成果获“2005年度国家科技进步奖二等奖”(第3完成人)。主要研究兴趣为人脸识别为主的视觉模式分析与识别、机器学习算法等。
陈熙霖,男,博士、研究员、博士生导师,现任中科院计算所数字媒体研究中心主任。1988年、1991年和1994年分别于哈尔滨工业大学计算机系获得学士、硕士和博士学位。近年来主要研究领域为计算机视觉、模式识别、多媒体技术以及多模式人机接口。先后获得国家科技进步二等奖三项,省部级科技进步奖7项,以及863计划15周年先进个人贡献奖。获得国家发明专利四项,合作出版《计算机视觉》专著一本,在多种国内外刊物和会议上发表论文100多篇。担任过十多个国际学术会议的程序委员会委员。
人脸识别技术是这样发展的
人脸识别是一个被广泛研究着的热门问题,大量的研究论文层出不穷。为了更好地对人脸识别研究的历史和现状进行介绍,我们将按照研究内容、技术方法等方面的特点大体划分为三个时间阶段来作介绍。
第一阶段(1964~1990年)
这一阶段人脸识别通常只是作为一个一般性的模式识别问题被研究,所采用的主要技术方案是基于人脸几何结构特征(Geometric feature based)的方法,这集中体现在人们对于剪影(Profile)的研究上,人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。人工神经网络也一度曾经被研究人员用于人脸识别问题中。较早从事AFR研究的研究人员除了Bledsoe外还有Goldstein,Harmon以及Kanade等。Kanade博士于1973年在京都大学完成了第一篇AFR方面的博士论文,直到现在,作为卡内基-梅隆大学(CMU)机器人研究院的一名教授,Kanade博士仍然是人脸识别领域的活跃人物之一,他所在的研究组也是人脸识别领域的一支重要力量。总体而言,这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。
第二阶段(1991~1997年)
这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可谓硕果累累:不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的FERET人脸识别算法测试,并出现了若干商业化运作的人脸识别系统,比如最为著名的Visionics(现为Identix)的FaceIt系统。
麻省理工学院媒体实验室的Turk和Pentland提出的“Eigenface”方法无疑是这一时期内最负盛名的人脸识别方法。其后的很多人脸识别技术都或多或少与Eigenface有关系,现在Eigenface已经与归一化的协相关量(Normalized Correlation)方法一道成为人脸识别的性能测试基准算法。
这一时期的另一个重要工作是麻省理工学院AI实验室的Brunelli和Poggio于1992年左右做的一个对比实验,他们对比了基于结构特征的方法与基于模板匹配的方法的识别性能,并给出了一个比较确定的结论:模板匹配的方法优于基于特征的方法。这一导向性的结论与Eigenface共同作用,基本中止了纯粹的基于结构特征的人脸识别方法研究,并在很大程度上促进了基于表观(Appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别方法的发展——他们逐渐成为主流的人脸识别技术。
Belhumeur等提出的Fisherface人脸识别方法是这一时期的另一重要成果。该方法首先采用主成分分析(Principal Component Analysis,PCA,亦即Eigenface)对图像表观特征进行降维,在此基础上,采用线性判别分析(Linear Discriminant Analysis, LDA)的方法变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。该方法目前仍然是主流的人脸识别方法之一,产生了很多不同的变种。
MIT的Moghaddam则在Eigenface的基础上,提出了基于双子空间进行贝叶斯概率估计的人脸识别方法。人脸识别中的另一种重要方法——弹性图匹配技术(Elastic Graph Matching,EGM)也是在这一阶段提出的。
由美国国防部反毒品技术发展计划办公室资助的FERET(FacE REcognition technology Test)项目无疑是该阶段内的一个至关重要的事件。FERET项目的目标是要开发能够为安全、情报和执法部门使用的AFR技术。该项目包括三部分内容:资助若干项人脸识别研究、创建FERET人脸图像数据库、组织FERET人脸识别性能评测。该项目分别于1994年、1995年和1996年组织了3次人脸识别评测,几种最知名的人脸识别算法都参加了测试,极大促进了这些算法的改进和实用化。该测试的另一个重要贡献是给出了人脸识别的进一步发展方向:光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方向。
第三阶段(1998年~现在)
FERET’96人脸识别算法评估表明:主流的人脸识别技术对光照、姿态等由于非理想采集条件或者用户不配合造成的变化鲁棒性比较差。因此,光照、姿态问题逐渐成为研究热点。与此同时,人脸识别的商业系统进一步发展,为此,美国军方在FERET测试的基础上分别于2000年和2002年组织了两次商业系统评测。
以支持向量机(Support Vector Machines,SVMs)为代表的统计学习理论也在这一时期内被应用到了人脸识别与确认中来。SVMs是一个两类分类器,而人脸识别则是一个多类问题,通常有三种策略解决这个问题,即:类内差/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。
Blanz和Vetter等提出的基于3D变形(3D Morphable Model)模型的多姿态、多光照条件人脸图像分析与识别方法是这一阶段内一项开创性的工作。该方法在本质上属于基于合成的分析技术,可以使得人脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开,更加有利于人脸图像的分析与识别。实验表明,该方法在CMU-PIE(多姿态、光照和表情)人脸库和FERET多姿态人脸库上都达到了相当高的识别率,证明了该方法的有效性。
Shashua等在2001年提出了一种基于商图像的人脸图像识别与绘制技术。Basri和Jacobs则利用球面谐波(Spherical Harmonics)表示光照、用卷积过程描述朗博反射的方法解析地证明了一个重要的结论:由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。这为光照问题的解决提供了重要思路。
FERET项目之后,涌现了若干人脸识别商业系统,美国国防部有关部门进一步组织了针对人脸识别商业系统的评测——Face Recognition Vendor Test(FRVT),至今已经举办了两次:FRVT2000以及FRVT2002测试。这两次测试一方面对知名的人脸识别系统进行了性能比较,例如FRVT2002测试就表明Cognitec、Identix和Eyematic三个商业产品遥遥领先于其他系统,而它们之间的差别不大。另一方面则全面总结了人脸识别技术发展的现状:较理想条件下(正面签证照),针对37437人121589幅图像的人脸识别(Identification)最高首选识别率为73%,人脸验证(Verification)的等错误率大约为6%。FRVT测试的另一个重要贡献是还进一步指出了目前的人脸识别算法亟待解决的若干问题。
总体而言,目前非理想成像条件下的人脸识别问题逐渐成为研究的热点问题。而非线性建模方法、统计学习理论、基于Boosting的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。
作者简介
高文,男,博士、教授、博士生导师、第十届全国政协委员。1988年获哈尔滨工业大学计算机应用博士学位,1991年获日本东京大学电子学博士学位。近几年的主要研究兴趣包括视频编码与分析、手语识别与合成、人脸识别、数字图书馆等。已出版著作4部,发表科学论文400余篇。曾四次获得国家科技进步二等奖。
行业应用中普及尚需时日
王阳生,博士、博士生导师、研究员。2000年2月受聘于中科院自动化研究所,任研究员、博士生导师、人机交互联合实验室主任、国家863网络游戏战略研究组组长、生物特征认证与测评中心副主任等职。
尽管目前存在着多种识别技术,但由于不同场合有着不同的应用需求,尚没有一种识别技术能适用于所有的应用,因而人脸识别技术就有了其存在和发展的空间。
就像世界上不会出现完全相同的指纹一样,人脸也有着不可替代的惟一性。就连双胞胎你也只能说他们长得相像,而并非完全一样。正是由于这个缘故,人脸完全可以当作每个人的身份证件来使用。相比虹膜和指纹等识别技术,人脸识别技术具有采集方便、识别快速、不易假冒、识别精度高等优势,只需要用一个普通的摄像头就可以进行人脸采集,再经过特征提取、对齐、识别等步骤,系统就可以判断出采集的人脸的身份,可使适用于那些需要身份认证的场所。
在实际的应用中,由于目前的人脸识别方法主要集中在二维图像方面,比较容易受到光线、姿势、表情变化的影响,降低了识别的准确度,所以至今要建立一个鲁棒的人脸识别系统仍然是一件比较困难的事情。除此之外,在人脸识别的理论研究和产业化方面还有大量的工作要做,特别是利用三维信息进行人脸识别的技术,虽然目前面临着数据获取困难、海量存储和计算困难、识别方法不足等问题,但一旦在三维人脸识别上取得进展,将是识别领域中一个新的突破。
可以说,人脸识别技术在日常生活中已经有了一些应用。比如在公安系统帮助公安干警抓捕罪犯,在银行业务中帮助为银行柜台交易提供场景、客户脸部特征及点钞数字等信息可作为日后取证的重要手段等。但在各种需要身份认证的场所大量使用人脸识别技术,目前还有待技术和产品的进一步发展。在未来的3~5年内,我国的人脸识别技术将会进入稳定期,将能更多更快地投入到行业应用中去。 (徐昕)
人脸识别是这样面对挑战的
在我们生存的这个地球上,居住着近65亿人,每个人的面孔都由额头、眉毛、眼睛、鼻子、嘴巴、双颊等少数几个区域组合而成,它们之间的大体位置关系也是固定的,并且每张脸的大小不过七八寸见方,然而,它们居然就形成了那么复杂的模式,从而形成了在这个世界上找不出两张完全相同的人脸的结论。那么,区分如此众多的不同人脸的“特征”到底是什么?能否设计出具有同样的人脸识别能力的自动机器?这种自动机器的人脸识别能力是否能够超越人类自身?对这些问题的分析和解答无疑具有重要的理论和应用价值,这正是众多从事自动人脸识别研究的研究人员所面临的挑战。
然而,对这些问题的回答并不像看起来那么容易,即使在大量来自模式识别、计算机视觉、神经计算、生理学等领域的研究人员对自动人脸识别艰苦工作40余年之后,这些最基本的科学问题仍然困惑着研究人员。退一步讲,即使对我们自己,尽管我们每天都在根据面孔区分着亲人、同学、朋友、同事等,大多数人却很难准确的描述出自己到底是如何区分他们的,甚至描述不出自己熟悉的人有什么具体的特征,即使对专门从事相关的生理学、心理学、神经科学研究的一些专家,也很难描述清楚人类人脸识别的生理学过程。这意味着基于仿生学的人脸识别研究路线在实践上是难以操作的。当然,飞机的翅膀并不需要向鸟儿一样扇动,自动人脸识别的计算模型也未必只能模拟“人脑”。我们也许可以通过建立人脸识别的计算模型,这种计算模型可能是基于仿生神经网络的,也可能是纯粹基于统计的,或者是这二者之外的第三只眼睛,并通过构建实用的自动人脸识别系统来验证这些计算模型,以图回答上述问题。
人脸识别是一项既有科学研究价值,又有广泛应用前景的研究课题,国际上大量研究人员几十年的研究取得了丰硕的研究成果,自动人脸识别技术已经可以在某些限定条件下得到了成功应用。这些成果更加深了我们对于自动人脸识别这个问题的理解,尤其是对其挑战性的认识。尽管在海量人脸数据比对速度甚至精度方面,现有的自动人脸识别系统甚至可能已经超过了人类自身,但对于复杂变化条件下的一般人脸识别问题而言,自动人脸识别系统的鲁棒性和准确度还远不及人类,这种差距产生的本质原因现在还不得而知,毕竟我们对于人类自身的视觉系统的认识还同样肤浅,但从模式识别和计算机视觉等学科的角度,既可能意味着我们尚未找到对面部信息进行合理采样的有效传感器(考虑单目摄像机与人类双眼系统的差别),更可能意味着我们采用了不合适的人脸建模方法(人脸的内部表示问题),还有可能意味着我们并没有认识到自动人脸识别技术所能够达到的极限精度。但无论如何,赋予计算设备与人类似的人脸识别能力是众多该领域研究人员的梦想!相信随着研究的继续深入,我们的认识应该能够更加准确的逼近这些问题正确答案。
笔记本电脑也以貌取人
只要面对屏幕,如照镜子一般简单,设备就能辨识主人,并决定是否接受操作。这种颇有些神似特工的独特体验用到的正是“人脸识别技术”。如今,这项技术已经被应用到面向个人用户的笔记本电脑当中。联想天逸F30、方正S620都是应用这项技术的代表产品。
这类笔记本电脑是通过摄像头来辨认使用者容貌,实现机主信息识别,进而达到数据保护的目的。这项“以貌取人”的认证方式,为用户提供了全新的加密模式,与密码、安全锁以及指纹识别等安全保护措施互为补充,无疑进一步提高了笔记本电脑的安全级别。
据技术人员介绍,此项技术主要是运用了生物智能学科的人脸影像分析和识别技术,利用对人脸结构的五点特征定位,并启动五级安全认证机制来核比人脸数据库而实现的采用人像识别的安全设置。用户要进入windows登陆界面时,电脑就将自动通过内置摄像头对用户进行人像识别,将用户传入人像识别系统,系统对人脸密码进行分析鉴定后,允许合法身份进入电脑。
人像识别技术的另一大功用是,可以实时监视用户状态,在用户离开监视范围预先设置的时间限定之后,电脑将自动锁定计算机。假如有其他人试图进入电脑,人像识别系统则会自动将对方记录下来。
从目前的应用来看,这项技术的应用,但目前人脸识别的主要诉求是验证快捷,因此,在安全级别要求适中的环境中使用非常具有实用性。不仅提高了产品的安全性,更增加了笔记本电脑的娱乐感。因此,这项创新技术在笔记本上的成功应用,这也预示着一种趋势,笔记本厂商正在重新回归对应用的关注。
(刘洪宇)