论文部分内容阅读
人脸检测与识别主要是研究在图像或视频中自动地查找定位人脸或面部特征以及识别身份、表情与姿态等的理论。人脸检测与识别是一个很复杂的问题,其本质的困难在于姿态、光照、表情等变化因素造成的人脸模式的可变性。现有的算法在可控环境下取得了较为理想的性能指标,但总体上还缺乏对上述变化因素的适应能力。在上述的多种变化因素中,姿态变化是最难以处理的,且对检测与识别算法的性能也影响最大。有鉴于此,本文展开了多姿态人脸检测与识别的研究。给出了组成一个相对完整的人脸检测与识别系统的几个核心的处理步骤,其中包括:多姿态人脸检测、姿态估计、特征定位以及多姿态人脸识别算法。在这个过程中,也采用了非线性流形学习的算法或借鉴其基本思想提出自己的算法,来解决姿态估计、人脸识别等问题。论文的主要研究工作与成果包括了以下几个主要方面的内容:(1)提出了一种基于Real AdaBoost算法的区域边缘方位场匹配的正面人脸检测方法。提取人脸图像的边缘方位场特征,采用Real AdaBoost算法通过迭代学习获取人脸特征模式。为保证检测的实时性,采用了级联式的分类器结构以及多分辨率图像搜索策略。(2)提出了一种协作AdaBoost的多特征多姿态人脸检测算法。采用边缘方位场特征与Harr小波特征:提出了协作Adaboost算法实现多特征的融合;将大姿态角范围的人脸检测问题,分解为若干个小范围内的人脸检测问题,并采用金字塔型的分类器系统结构提高检测效率。(3)针对大范围姿态角度下的人脸特征定位问题,提出了一种基于分级边缘方位场匹配的算法。提出了结构Hausdoff距离作为边缘方位场匹配的测度;采用整体边缘方位场进行姿态预估,粗步定位特征;然后采用单特征边缘方位场在局部区域搜索得到精确的特征定位信息。(4)根据特征定位给出的特征区域的位置信息,提出了一种基于非线性流形学习的人脸姿态估计算法。采用结构Hausdoff距离进行边缘方位场的匹配;在特征定位的基础上进行特征的校正;采用Isomap算法,实现非线性数据降维;最后,建立低维特征映射数值与对应的姿态角之间的关系,并由此估计新图像数据的姿态角度。(5)在人脸检测、特征定位以及姿态估计的基础上,提出了关联子区域映射的多姿态人脸识别方法。将人脸图像分割为若干子区域,姿态变化对图像的影响被分解为关联子区域的形状映射与纹理映射。提出了二维耦合成分分析的方法构造关联子区域的映射关系。在应用贝叶斯框架评估子区域的可分性的基础上,综合全体子区域的信息给出最终的判别结果。(6)提出了一种非线性流形的判别分析方法并应用于人脸识别。采用测地距离来表达数据间的非线性关系,构造测地Gabriel图在非线性流形上划分出异类样本相互靠近的局部区域,进而在这些局部区域上进行线性判别分析。整体的非线性判别器由多个局部判别器融合得到:基于柔性边界准则函数,以迭代优化的方式,为每个局部判别器分配最佳的权重系数,整体上逐步提高异类样本间的区分度。