论文部分内容阅读
[摘 要]随着科技的不断进步,让眼镜的检测与定位方面也取得了长足的进步,眼镜不仅仅给眼睛近视和远视的人们带来了清晰的世界,也为人们带来了另一种别具一格的气质。但是就目前而言,眼镜的检测和定位方面还需要加大力度,尤其是深色边框眼镜的检测和定位。
[关键词]检测;定位;瞳距;预处理
中图分类号:TS736+.2 文献标识码:A 文章编号:1009-914X(2015)06-0171-01
引言
随着时尚的不断变化,让眼镜不仅仅是作为一种辅助人们视野的一种工具,还是一种时尚单品,这也让眼镜的形状、颜色等外观特征变得多样化起来,但是这种变化却加大了对图像中眼镜的检测和定位的难度。
一、 眼镜检测和定位的重要性
随着科学技术的发展,各种身份认证系统以及人机交互系统得到广泛的应用,其中通常会遇到的一种技术就是人脸识别技术,而在人脸识别技术中时常采用的一些方法包括特征脸以及支持向量机(SVM)等,但是对于这些方法来说,仅仅局限于不戴眼镜的人的面部特征,但是对于戴眼镜的人来说,系统则会出现误认、错认等现象。而对于浅色边框的眼镜来说,可以通过对,模糊和平滑等手段来使其人脸识别的错误现象得到有效降低,礎嵌杂谏钌呖虻难劬道此担虢屑觳夂投ㄎ辉蚧岜惹成呖蜓劬狄岩恍枰扇∫欢ǖ氖侄卫茨芡瓿杉觳夂投ㄎ弧T谘劬导觳庵校梢酝ü枷翊砘蛘呤悄0迤ヅ涞姆椒ǎ桓菹袼夭涣浠幕叶戎到醒劬迪卤呖虻募觳猓换蛘呤峭ü窖矍虻谋咴敌畔⒔醒劬档募觳狻6杂谘劬档亩ㄎ焕此担梢圆捎玫姆椒òǎ喝琀OUGH变换方法、主动形状模型(ASM)、主动外观模型(AAM)等。
二、 眼镜检测的预处理
在检测深色边框眼镜之前,需要先进行人脸位置区域的定位,再进一步将眼镜的水平位置找出。在对人脸区域进行定位的方法大致包括三种,第一种是在知识的基础上进行人脸检测的方法,它主要是通过对人脸部器官的肤色、边缘特征以及几何分布等先验知识的利用来进行人脸规则的构造判断的;第二种是模板匹配法,也就是预先进行人脸各特征的模板进行定义和描述,然后对模板相关程度加以计算,进而进行判断;第三种是在样本学习的基础上进行的一种方法,例如通过LDA等统计方法的使用,来学习人脸样本,进而获得人脸模式分布模型。本文采取其中比较简单的一种方法,即通过统计大量的图像,进行一个合适阙值的确定,再通过二值化进行图像的处理,因此需要对二值图形进行垂直和水平的投影。其中二值水平投影的定义公式为:
其二值垂直投影的定义公式则为:
1≤y≤n
其中f是原始图像根据阙值二值化所形成的图像,其图像的分辨率为m×n,f(x,y)就是对二值图像中第x行第y列像素值的表示。在图像经过二值化之后,在整个图像中基本只有头发占据着连续黑色区域中最明显的位置,因此将投影图的level(x)最大值令为v_m,则取v_m所在位置是人像头发经过的位置position_hair(p_h)。在p_h这条水平线上,可以将人像头发起止位置找出来,从这个位置开始,在(起始位置,终止位置)的范围内进行二值图像的向下查找,直至有连续白色像素点出现的宽度比某一事先规定值要大为止,这个位置就是图像中头发与人脸之间的交界线,可以将其作为人脸上边界top。得到top之后,通过对二值垂直投影定义公式的利用,在(起始位置,(起止位置)/3)的区域中,将其垂直投影的最大值找到,即可获得人脸左边界left;在((起止位置)/3,终止位置)的区域中,将其垂直投影的最大值找到,即可获得人脸右边界right。因为通常人脸的宽和长都存在一定比例,因此可以获得人脸下边界bottom,从而就可以在图像中得到人脸区域area,即:
area={(x,y)|top≤x≤bottom,left≤y≤right}
再将二值水平投影在人脸矩形区域中进行,得到投影Cline(x):
通过所得到的峰值可以发现,投影中的各个峰分别代表的是人脸器官以及眼镜上下框的位置,再根据各个峰的顺序位置以及已知人脸宽、眼睛到嘴巴距离比例关系进行眼睛水平位置的确定。
三、 对人像中深色边框眼镜的检测
在检测图像中,人是否进行了深色边框眼镜的佩戴,都极大影响着Cline(x)。如果佩戴了深色边框眼镜,那么就会增加Cline(x)中峰的数量,同时也会增大其峰值,不仅如此,因为佩戴眼镜所产生的阴影现象,使其Cline(x)中眼睛水平位置还会有一个明显的峰值出现。根据这一特征,再加上对该峰值的位置(pos)和眼睛水平位置(eye_pos)的距离是否满足人脸所具备的的一定比例关系的检查公式N:
N≈|pos-eye_pos|/|bottom-top|
就可以对人像是否进行深色边框眼镜的佩戴加以判定。
四、 对人像中深色边框眼镜的定位
在上述检测中,获得了眼镜下边框、眼睛以及眉毛以下的位置,进而可以对眼镜的高度进行大体确定,其眼镜的宽度就可以由人脸宽度来表示。并在其图像范围内进行其边缘的查找,使其二值化之后对眼镜边框(BG)加以跟踪。但是有的时候,会出现眉毛、眼睛和眼镜上边框相重合的现象,这表明在定位中眉毛和眼睛会影响眼镜边框的确定。这就需要对其进行一定程度的处理,结合双眼水平位置(eye_pos)和人脸宽度比例关系,可以将人像双眼的两个矩形区域的位置加以确定,并将其去除;然后在根据其眼镜上下边框宽度大致一样的前提下,在双眼位置的垂直方向进行对眼镜边框的检测,如果检测出上边框的宽度远大于下边框,那么就需要将上边框的边沿部分适当消除掉。
也就是说在实施深色边框眼镜的检测定位过程中,先要输入图像,接着进行人脸区域的确定,再进行图像的二值水平投影,其次结合上述公式N来对图像中人是否进行深色边框眼镜佩戴的判断,如果判断出有眼镜佩戴在人像上,那么就将其眼镜框定位出来,这样就完成了人像是否进行深色边框眼镜的检测和定位了。
结束语
总而言之,眼镜作为人脸图像中常见的一种配饰物,在对图像中人脸上是否有佩戴眼镜的自动判定,并计算其眼镜的位置和形状,对人脸识别算法性能的提高,以及生成人脸对象媒体有着重要的影响。当然,本文虽然能够完成眼镜的检测和定位,但是在预处理中还存在有一定的不足,因此还有待加强对预处理方法的研究。
参考文献
[1]孟照军.论验配眼镜检测的通用方法[J].科技与企业,2013,(8).
[2]任明罡,陈岳林.基于人脸图片边缘信息的眼镜检测[J].软件导刊,2014,(7).
[3]金俊才. 一种人脸、眼镜和人脸姿态的高性能检测算法[D].华东师范大学,2013.
[4]李丙春. 单张人脸图像眼镜边框摘除方法[J].伊犁师范学院学报(自然科学版),2014,03:65-68.
[关键词]检测;定位;瞳距;预处理
中图分类号:TS736+.2 文献标识码:A 文章编号:1009-914X(2015)06-0171-01
引言
随着时尚的不断变化,让眼镜不仅仅是作为一种辅助人们视野的一种工具,还是一种时尚单品,这也让眼镜的形状、颜色等外观特征变得多样化起来,但是这种变化却加大了对图像中眼镜的检测和定位的难度。
一、 眼镜检测和定位的重要性
随着科学技术的发展,各种身份认证系统以及人机交互系统得到广泛的应用,其中通常会遇到的一种技术就是人脸识别技术,而在人脸识别技术中时常采用的一些方法包括特征脸以及支持向量机(SVM)等,但是对于这些方法来说,仅仅局限于不戴眼镜的人的面部特征,但是对于戴眼镜的人来说,系统则会出现误认、错认等现象。而对于浅色边框的眼镜来说,可以通过对,模糊和平滑等手段来使其人脸识别的错误现象得到有效降低,礎嵌杂谏钌呖虻难劬道此担虢屑觳夂投ㄎ辉蚧岜惹成呖蜓劬狄岩恍枰扇∫欢ǖ氖侄卫茨芡瓿杉觳夂投ㄎ弧T谘劬导觳庵校梢酝ü枷翊砘蛘呤悄0迤ヅ涞姆椒ǎ桓菹袼夭涣浠幕叶戎到醒劬迪卤呖虻募觳猓换蛘呤峭ü窖矍虻谋咴敌畔⒔醒劬档募觳狻6杂谘劬档亩ㄎ焕此担梢圆捎玫姆椒òǎ喝琀OUGH变换方法、主动形状模型(ASM)、主动外观模型(AAM)等。
二、 眼镜检测的预处理
在检测深色边框眼镜之前,需要先进行人脸位置区域的定位,再进一步将眼镜的水平位置找出。在对人脸区域进行定位的方法大致包括三种,第一种是在知识的基础上进行人脸检测的方法,它主要是通过对人脸部器官的肤色、边缘特征以及几何分布等先验知识的利用来进行人脸规则的构造判断的;第二种是模板匹配法,也就是预先进行人脸各特征的模板进行定义和描述,然后对模板相关程度加以计算,进而进行判断;第三种是在样本学习的基础上进行的一种方法,例如通过LDA等统计方法的使用,来学习人脸样本,进而获得人脸模式分布模型。本文采取其中比较简单的一种方法,即通过统计大量的图像,进行一个合适阙值的确定,再通过二值化进行图像的处理,因此需要对二值图形进行垂直和水平的投影。其中二值水平投影的定义公式为:
其二值垂直投影的定义公式则为:
1≤y≤n
其中f是原始图像根据阙值二值化所形成的图像,其图像的分辨率为m×n,f(x,y)就是对二值图像中第x行第y列像素值的表示。在图像经过二值化之后,在整个图像中基本只有头发占据着连续黑色区域中最明显的位置,因此将投影图的level(x)最大值令为v_m,则取v_m所在位置是人像头发经过的位置position_hair(p_h)。在p_h这条水平线上,可以将人像头发起止位置找出来,从这个位置开始,在(起始位置,终止位置)的范围内进行二值图像的向下查找,直至有连续白色像素点出现的宽度比某一事先规定值要大为止,这个位置就是图像中头发与人脸之间的交界线,可以将其作为人脸上边界top。得到top之后,通过对二值垂直投影定义公式的利用,在(起始位置,(起止位置)/3)的区域中,将其垂直投影的最大值找到,即可获得人脸左边界left;在((起止位置)/3,终止位置)的区域中,将其垂直投影的最大值找到,即可获得人脸右边界right。因为通常人脸的宽和长都存在一定比例,因此可以获得人脸下边界bottom,从而就可以在图像中得到人脸区域area,即:
area={(x,y)|top≤x≤bottom,left≤y≤right}
再将二值水平投影在人脸矩形区域中进行,得到投影Cline(x):
通过所得到的峰值可以发现,投影中的各个峰分别代表的是人脸器官以及眼镜上下框的位置,再根据各个峰的顺序位置以及已知人脸宽、眼睛到嘴巴距离比例关系进行眼睛水平位置的确定。
三、 对人像中深色边框眼镜的检测
在检测图像中,人是否进行了深色边框眼镜的佩戴,都极大影响着Cline(x)。如果佩戴了深色边框眼镜,那么就会增加Cline(x)中峰的数量,同时也会增大其峰值,不仅如此,因为佩戴眼镜所产生的阴影现象,使其Cline(x)中眼睛水平位置还会有一个明显的峰值出现。根据这一特征,再加上对该峰值的位置(pos)和眼睛水平位置(eye_pos)的距离是否满足人脸所具备的的一定比例关系的检查公式N:
N≈|pos-eye_pos|/|bottom-top|
就可以对人像是否进行深色边框眼镜的佩戴加以判定。
四、 对人像中深色边框眼镜的定位
在上述检测中,获得了眼镜下边框、眼睛以及眉毛以下的位置,进而可以对眼镜的高度进行大体确定,其眼镜的宽度就可以由人脸宽度来表示。并在其图像范围内进行其边缘的查找,使其二值化之后对眼镜边框(BG)加以跟踪。但是有的时候,会出现眉毛、眼睛和眼镜上边框相重合的现象,这表明在定位中眉毛和眼睛会影响眼镜边框的确定。这就需要对其进行一定程度的处理,结合双眼水平位置(eye_pos)和人脸宽度比例关系,可以将人像双眼的两个矩形区域的位置加以确定,并将其去除;然后在根据其眼镜上下边框宽度大致一样的前提下,在双眼位置的垂直方向进行对眼镜边框的检测,如果检测出上边框的宽度远大于下边框,那么就需要将上边框的边沿部分适当消除掉。
也就是说在实施深色边框眼镜的检测定位过程中,先要输入图像,接着进行人脸区域的确定,再进行图像的二值水平投影,其次结合上述公式N来对图像中人是否进行深色边框眼镜佩戴的判断,如果判断出有眼镜佩戴在人像上,那么就将其眼镜框定位出来,这样就完成了人像是否进行深色边框眼镜的检测和定位了。
结束语
总而言之,眼镜作为人脸图像中常见的一种配饰物,在对图像中人脸上是否有佩戴眼镜的自动判定,并计算其眼镜的位置和形状,对人脸识别算法性能的提高,以及生成人脸对象媒体有着重要的影响。当然,本文虽然能够完成眼镜的检测和定位,但是在预处理中还存在有一定的不足,因此还有待加强对预处理方法的研究。
参考文献
[1]孟照军.论验配眼镜检测的通用方法[J].科技与企业,2013,(8).
[2]任明罡,陈岳林.基于人脸图片边缘信息的眼镜检测[J].软件导刊,2014,(7).
[3]金俊才. 一种人脸、眼镜和人脸姿态的高性能检测算法[D].华东师范大学,2013.
[4]李丙春. 单张人脸图像眼镜边框摘除方法[J].伊犁师范学院学报(自然科学版),2014,03:65-68.