人脸检测和识别技术的研究

被引量 : 64次 | 上传用户:cox_7261
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展,信息化程度的不断提高,人们对身份鉴别的准确性、安全性和实用性提出了更高的要求,传统的身份识别方式已经不能满足这种要求。生物特征识别作为一项利用人类特有的生理特征(如指纹、人脸、虹膜、视网膜等)或行为特征(如签名、声音、步态等)进行身份识别的技术,由于它提供了一种高可靠性、高稳定性的身份鉴别途径,引起了国际学术界和企业界的广泛关注。人脸是人类识别不同人的最主要的人体生物特征,与其他人体生物特征(指纹、掌纹、虹膜、声音、笔迹)相比,它不仅具有很强的自身稳定性和个体差异性,而且直接、友好,更符合人类的视觉习惯。这些优点使得人脸识别技术在身份识别、自动监控、人机交互等众多领域有着很大的发展潜力。目前,人脸识别是生物特征识别中倍受人们关注的一个分支,已成为计算机视觉与模式识别领域中非常活跃的一个研究领域。人脸识别是对于输入的人脸图像或视频,首先判断其中是否存在人脸,如果存在人脸,则进一步给出每个人脸的位置、大小以及各个主要面部器官的位置信息,并依据这些信息,进一步提取每个人脸中所蕴含的特征,并将其与已知人脸库中的人脸图像进行对比,从而得到识别结果。由此可见,一个完整的人脸识别过程应包括人脸检测与人脸识别两大部分。人脸检测作为人脸信息处理中的一项关键技术,近年来成为模式识别与计算机视觉领域内一项受到普遍重视、研究十分活跃的课题,已经广泛应用于各种不同领域中。人脸检测技术的研究,由于受到背景、姿态、尺寸、光照以及检测时间等的影响,大部分算法都是在一定的约束条件下提出的。因此,研究鲁棒性较高的人脸检测问题是十分有必要的。人脸识别技术经过约四十年的研究,在环境可控的条件下已达到实用程度,但是在考虑光照、姿态、表情、遮挡等变化的影响时,很多人脸识别算法性能大大下降,其应用范围也受到了较大的限制。因此,研究对各种变化鲁棒的人脸识别技术是当前的研究热点。一个较理想的人脸识别算法应该对光照变化和姿势变化具有较强的适应性。本论文在分析总结国内外近年来人脸检测和人脸识别的相关研究成果和最新研究进展的基础上,针对目前急需改进和提高的人脸检测和人脸识别中的几个关键问题进行了系统的实验和理论研究;提出并实现了几种有实际应用价值的人脸检测和人脸识别算法。论文的研究内容主要包括:彩色图像中的人脸检测、小样本人脸识别、光照变化下的人脸识别和三维人脸识别。在论文的具体研究过程中,力图将统计学习理论、随机方法与模式识别理论和应用紧密结合起来。本论文所做的主要工作和创新点包括以下四个方面:(1)提出了一种基于YCgCr色彩空间的自适应阈值选取的肤色分割方法。该方法改进了二维Otsu阈值分割方法,在对图像像素进行初始分割后,根据松弛迭代的区域增长算法判定待定像素的归属。在此肤色分割方法的基础上,实现了基于肤色信息的人脸检测。首先在YCgCr色彩空间中通过离线训练建立肤色模型;然后利用该肤色模型对待检测图像进行肤色相似度计算,得到肤色相似度图像;进而结合像素的空间邻域信息,使用自适应阈值选取的肤色分割新方法对肤色相似度图像进行二值化处理。大量的实验结果表明,该肤色分割方法有效的克服了使用固定阈值进行图像分割的缺陷。对于二值化结果图像,对其进行了基于数学形态学的滤波处理,进而利用区域的面积和高宽比等信息对其进行粗筛选,将此筛选结果作为候选人脸区域输出。进而使用了欧拉数与眼睛定位相结合的方法,对粗筛选后的候选区域进行了再次筛选与验证,得出了最后结果。文中使用结合亮度信息和PCA边缘方向的算法来定位候选人脸区域中的眼睛。实验证明了该人脸检测和眼睛定位方法具有很好的稳健性和有效性。(2)对线性鉴别分析及其应用于小样本情况下的几种改进方法进行详细分析,指出了这些方法在提取鉴别特征时存在的不足,在此基础上提出一种新的基于两空间的线性鉴别分析方法,进而将该方法拓展到非线性领域,并通过实验分析进行验证。人脸识别是一个典型的小样本问题,实际情况下不可能有足够的样本使得类内散布矩阵可逆,因此无法直接采用经典的线性鉴别分析方法进行特征提取。本文对fisherfaces、EFM、DLDA以及NLDA四种以解决小样本问题为目的的线性鉴别方法进行了深入的理论分析,证明了采用这四种方法所提取的特征的不完整性。在此基础上提出了一种基于两空间线性鉴别分析的人脸识别方法(TLDA)。为了提高计算效率,首先将样本投影到总体散布矩阵的非零空间中进行分析;进而将类内散布矩阵分成零空间和非零空间进行鉴别向量的确定和鉴别特征的提取,最后将得到的两种鉴别特征进行融合,从而使用最近邻法进行分类。在ORL人脸库和UMIST人脸库的子库上的实验结果验证了所提出的方法的有效性和优越性。对核方法的基本理论构架进行了较为深入的研究,在此基础上将TLDA方法拓展为非线性的两空间核鉴别分析(TKDA)方法。该方法继承了TLDA方法的优点,而且还能有效的提取非线性特征。在光照变化较大的Extended Yale B子库上的实验结果表明,该方法能有效的简化人脸模式的复杂分布,且能较大幅度的提高分类效果。(3)研究了光照变化下的人脸识别技术,提出了两个处理光照变化的方法:基于局部标准化的光照规范化模型和基于对数域离散余弦变换的方法,并通过实验证明了这两种方法的有效性。提出一种局部标准化方法处理光照变化下的人脸图像。从理论上证明了使用局部标准化技术得到的像素值是由规范化光照条件下的像素值及规范化光照条件下小面片上像素的统计特征所决定的,即经过局部标准化处理之后,光照变化下的人脸图像的像素值等于规范光照条件下的像素值,故该方法能够消除不均匀光照的影响。使用Yale B人脸数据库和Extended Yale B人脸数据库测试了该方法的有效性。提出了一种基于对数域离散余弦变换的光照补偿方法。考虑到光照变化主要集中在低频域中,因此可以通过抛弃一定数量的低频部分DCT系数达到最小化光照条件变化引起的图像变化的目的。使用Yale B人脸数据库和ExtendedYale B人脸数据库测试了该方法的有效性。(4)在介绍现有的三维人脸识别方法和三维数据获取技术的基础上,研究了使用三维人脸模型进行不同姿势下的人脸识别问题,提出了一种将三维人脸模型投影成二维图像的方法,进而将不同方向的投影结果与不同姿势下的二维图像相匹配,以达到人脸识别的目的。在此过程中,详细研究了使用MinoltaVivid 910进行数据获取,创建三维模型的方法和过程。人脸检测与识别是极具挑战的研究课题,亟待研究和解决的问题比比皆是。人脸检测与识别的难度大,这一方面受限于很难提取出每个人的具有唯一判别标志的人脸特征,特别是各种变化因素的影响使得提取每个人的标识特征更加困难;另一方面,尽管一些算法能较好的处理某些变化因素,但极大的运算负担使其不适合于实际应用。但是,随着感知科学、心理学、计算机图形学、计算机视觉、图像处理与分析、模式识别等多个研究领域的发展,人脸识别技术也必将日臻成熟。对于一个安全性要求很高的身份识别系统,将人脸识别技术和密码、指纹等技术手段融合起来是必要的。
其他文献
直接空冷机组可采用高背压供热和低背压抽汽供热两种方式,为了比较两种方式的热经济性,构建了热经济性分析模型,通过计算,分析比较了定主蒸汽流量和定功率条件下,某330MW机组不同
随着我国经济的迅猛发展,中国的休闲产业正经历着一场巨大的变化,出现了一系列诸如“休闲时代”、“休闲经济”、“休闲产业”、“休闲餐饮"、“休闲食品”等和休闲相关的概念
本文主要内容是关于新型高性能半导体泵浦固体激光器电源技术的研究。随着激光产业的发展,大功率半导体泵浦固体激光器在工业加工中的应用也愈来愈广泛,同时对作为激光器重要
学分制是目前我国高校正在推行的一项教学管理制度,它对高校的教学、管理、科研、后勤等各方面都有着重要的影响。大学生自主管理是大学生身心发展的客观需要。在传统的大学
2001年,随着我国正式加入世贸组织,新经济和供应链竞争时代的到来,农产品加工企业面临着一个全新的竞争环境。如何利用新思想、新技术、新方法来改善农产品加工企业采购和供
镜意象是我国古典文学中的传统意象,在历代作品中都可见其踪迹。早在先秦时期,镜就被赋予了象征意味,引申为清明之道的象征,且赋予了劝惩和自省之义。秦汉至六朝,镜意象进一
由于农业的基础地位,迫切需要加强对农业的支持和保护。中国农业发展银行正是顺应时代要求,承担着国家粮棉油收购资金管理的重要任务。但随着我国粮食市场改革的全面放开,农
本文以鲁南五大调产生的地区环境、时代背景等因素进行纵向剖析,着重从鲁南五大调的内容题材、结构艺术、演唱风格与特点进行了认真而详实地分析整理和挖掘,力图从古为今用,保护
随着高效率、高功率的LD及其阵列的突破性发展,LD泵浦的固体激光器的研究也不断取得进展并达到实用化水平。LD泵浦的固体激光器具有高效率、高稳定性、窄线宽、较长的使用寿
对老视的矫正和治疗正受到越来越多的关注,其矫正方式多样.以生物工程制备的脱细胞角膜基质作为较理想的角膜替代材料在临床上已开始应用.本文介绍生物工程角膜的特点及优势,