论文部分内容阅读
摘 要:猫脸识别技术目前被广泛应用在工业界,其中最重要也是最开始的一步就是需要进行猫脸检测。本文采用Haar特征进行猫脸的特征提取,快速计算Haar矩形特征值——积分图,筛选有效的矩形特征用于分类识别,采用AdaBoost分类器将弱分类器变成强分类器能够有效的检测猫脸。
关键词:猫脸检测;Haar特征;级联分类器
一、引言
猫脸检测是机器视觉领域被深入研究的经典问题,在宠物检测、宠物饲养等领域都有重要的应用价值。在猫脸识别的流程中,猫脸检测是整个猫脸识别算法的第一步。早期的面部测算法使用了模板匹配技术,即用一个面部模板图像与被检测图像中的各个位置进行匹配,确定这个位置处是否有猫脸;此后机器学习算法被用于该问题,包括神经网络,支持向量机等。以上都是针对图像中某个区域进行人脸-非人脸二分类的判别。早期有代表性的成果是Rowley等人提出的方法。他们用神经网络进行人臉检测,用20x20的人脸和非人脸图像训练了一个多层感知器模。该方法解决多角度人脸检测问题,整个系统由两个神经网络构成,第一个网络用于估计人脸的角度,第二个用于判断是否为人脸。角度估计器输出一个旋转角度,然后用整个角度对检测窗进行旋转,然后用第二个网络对旋转后的图像进行判断,确定是否为人脸。Haar特征[1]是一种用于目标检测或识别的图像特征描述子,Haar特征通常和AdaBoost[2]分类器组合使用,用多个AdaBoost[2]分类器合作完成对候选框的分类,这些分类器组成一个流水线,对滑动窗口中的候选框图像进行判定,确定它是猫脸还是非猫脸。
二、Haar特征提取
Haar-like特征是白色矩形框内的像素值之和,减去黑色区域内的像素值之和。如图1中第一个特征为例,它的计算方法如下:首先计算左边白色矩形区域里所有像素值的和,接下来计算右边黑色矩形区域内所有像素的和,最后得到的Haar-like特征值为左边的和减右边的和。这种特征捕捉图像的边缘、变化等信息,各种特征描述在各个方向上的图像变化信息。人脸的五官有各自的亮度信息,很符合Haar-like特征的特点。
为了实现快速计算,使用了一种称为积分图(Integral Image)的机制。通过积分图可以快速计算出图像中任何一个矩形区域的像素之和,从而计算出各种类型的Haar-like特征。假设有一张图像,其第i行第j列处的像素值为 ,积分图定义为: 即原始图像在任何一点处的左上角元素之和。在构造出积分图之后,借助于它可以快速计算出任何一个矩形区域内的像素之和,以图2中的矩形框为例:
在上图中,要计算黑色矩形框内的像素值之和。假设上面四个矩形的右下角的坐标分别为:
黑色色矩形框内的像素值之和为:
之所以这样,是因为黑色区域内的像素值之和等于这4个矩形框内的像素值之和,减去上面两个矩形框的像素值之和,再减去左边两个矩形框的像素值之和,这样做的话,左上角的矩形框被减了两遍,因此要加一遍回来。在计算出任何一个矩形区域的像素值之和后,可以方便的计算出上面任何一种Haar-like特征。
三、AdaBoost级联分类器
弱分类器采用最简单的深度很小的决策树,甚至只有一个内部节点。决策树的训练算法此处不做详细的阐述,需要注意的是这里的特征向量是稀疏的,即每一棵决策树只接受少量特征分量的输入,根据它们来做决策。强分类器和前面讲述的是一样的,不同的是这里的强分类器加上了一个调节阈值:
其中ε为阈值,它通过训练得到。每一级强分类器在训练时使用所有的人脸样本作为正样本,并用上一级强分类器对负样本图像进行扫描,把找到的虚警中被判定为人脸的区域截取出来作为下一级强分类器的负样本。
假设第i级强分类器的检测率和误报率分别为di和fi,由于要通过了所有强分类器才被判定为正样本,因此级联分类器的误报率为: 上式表明增加分类器的级数可以降低误报率,类似的级联分类器的检测率为:
这个式子表明增加分类器的级数会降低检测率。对于前者,可以理解为一个负样本被每一级分类器都判定为正样本的概率;对于后者,可以理解为一个正样本被所有分类器都判定为正样本的概率。在VJ算法问世之后,较好的解决了近似正面人脸的检测问题。此后出现了大量改进方案,在深度学习技术出现之前,一直是人脸检测算法的主流框架。这些方案的改进主要在以下几个方面:新的特征,包括扩展的Haar特征[1],ACF特征等,它们比标准的Haar-like特征有更强的描述能力,同时计算成本也很低。使用其他类型AdaBoost分类器。VJ框架中采用的是离散型的AdaBoost算法,分类器级联结构,如Soft Cascade,将VJ方法的多个强分类器改成一个强分类器。另外,检测处于各种角度和姿态的人脸是研究另一个重点,VJ方法的分类器级联只有一条路径,是瀑布模型,改进的方案有树状级联,金字塔级联等。
参考文献:
[1].Wilson P I , Fernandez D J . Facial feature detection using Haar classifiers[J]. Journal of Computing Sciences in Colleges, 2006, 21(4):127-133.
[2].Zhu J , Arbor A , Hastie T . Multi-class AdaBoost[J]. Statistics & Its Interface, 2006, 2(3):349-360.
作者简介:李星星;1991.4;男;江西九江;广州工商学院;无 ;模式识别与图像处理
关键词:猫脸检测;Haar特征;级联分类器
一、引言
猫脸检测是机器视觉领域被深入研究的经典问题,在宠物检测、宠物饲养等领域都有重要的应用价值。在猫脸识别的流程中,猫脸检测是整个猫脸识别算法的第一步。早期的面部测算法使用了模板匹配技术,即用一个面部模板图像与被检测图像中的各个位置进行匹配,确定这个位置处是否有猫脸;此后机器学习算法被用于该问题,包括神经网络,支持向量机等。以上都是针对图像中某个区域进行人脸-非人脸二分类的判别。早期有代表性的成果是Rowley等人提出的方法。他们用神经网络进行人臉检测,用20x20的人脸和非人脸图像训练了一个多层感知器模。该方法解决多角度人脸检测问题,整个系统由两个神经网络构成,第一个网络用于估计人脸的角度,第二个用于判断是否为人脸。角度估计器输出一个旋转角度,然后用整个角度对检测窗进行旋转,然后用第二个网络对旋转后的图像进行判断,确定是否为人脸。Haar特征[1]是一种用于目标检测或识别的图像特征描述子,Haar特征通常和AdaBoost[2]分类器组合使用,用多个AdaBoost[2]分类器合作完成对候选框的分类,这些分类器组成一个流水线,对滑动窗口中的候选框图像进行判定,确定它是猫脸还是非猫脸。
二、Haar特征提取
Haar-like特征是白色矩形框内的像素值之和,减去黑色区域内的像素值之和。如图1中第一个特征为例,它的计算方法如下:首先计算左边白色矩形区域里所有像素值的和,接下来计算右边黑色矩形区域内所有像素的和,最后得到的Haar-like特征值为左边的和减右边的和。这种特征捕捉图像的边缘、变化等信息,各种特征描述在各个方向上的图像变化信息。人脸的五官有各自的亮度信息,很符合Haar-like特征的特点。
为了实现快速计算,使用了一种称为积分图(Integral Image)的机制。通过积分图可以快速计算出图像中任何一个矩形区域的像素之和,从而计算出各种类型的Haar-like特征。假设有一张图像,其第i行第j列处的像素值为 ,积分图定义为: 即原始图像在任何一点处的左上角元素之和。在构造出积分图之后,借助于它可以快速计算出任何一个矩形区域内的像素之和,以图2中的矩形框为例:
在上图中,要计算黑色矩形框内的像素值之和。假设上面四个矩形的右下角的坐标分别为:
黑色色矩形框内的像素值之和为:
之所以这样,是因为黑色区域内的像素值之和等于这4个矩形框内的像素值之和,减去上面两个矩形框的像素值之和,再减去左边两个矩形框的像素值之和,这样做的话,左上角的矩形框被减了两遍,因此要加一遍回来。在计算出任何一个矩形区域的像素值之和后,可以方便的计算出上面任何一种Haar-like特征。
三、AdaBoost级联分类器
弱分类器采用最简单的深度很小的决策树,甚至只有一个内部节点。决策树的训练算法此处不做详细的阐述,需要注意的是这里的特征向量是稀疏的,即每一棵决策树只接受少量特征分量的输入,根据它们来做决策。强分类器和前面讲述的是一样的,不同的是这里的强分类器加上了一个调节阈值:
其中ε为阈值,它通过训练得到。每一级强分类器在训练时使用所有的人脸样本作为正样本,并用上一级强分类器对负样本图像进行扫描,把找到的虚警中被判定为人脸的区域截取出来作为下一级强分类器的负样本。
假设第i级强分类器的检测率和误报率分别为di和fi,由于要通过了所有强分类器才被判定为正样本,因此级联分类器的误报率为: 上式表明增加分类器的级数可以降低误报率,类似的级联分类器的检测率为:
这个式子表明增加分类器的级数会降低检测率。对于前者,可以理解为一个负样本被每一级分类器都判定为正样本的概率;对于后者,可以理解为一个正样本被所有分类器都判定为正样本的概率。在VJ算法问世之后,较好的解决了近似正面人脸的检测问题。此后出现了大量改进方案,在深度学习技术出现之前,一直是人脸检测算法的主流框架。这些方案的改进主要在以下几个方面:新的特征,包括扩展的Haar特征[1],ACF特征等,它们比标准的Haar-like特征有更强的描述能力,同时计算成本也很低。使用其他类型AdaBoost分类器。VJ框架中采用的是离散型的AdaBoost算法,分类器级联结构,如Soft Cascade,将VJ方法的多个强分类器改成一个强分类器。另外,检测处于各种角度和姿态的人脸是研究另一个重点,VJ方法的分类器级联只有一条路径,是瀑布模型,改进的方案有树状级联,金字塔级联等。
参考文献:
[1].Wilson P I , Fernandez D J . Facial feature detection using Haar classifiers[J]. Journal of Computing Sciences in Colleges, 2006, 21(4):127-133.
[2].Zhu J , Arbor A , Hastie T . Multi-class AdaBoost[J]. Statistics & Its Interface, 2006, 2(3):349-360.
作者简介:李星星;1991.4;男;江西九江;广州工商学院;无 ;模式识别与图像处理