论文部分内容阅读
人脸检测的研究涉及模式识别、图像处理、生理学等多门学科,并与基于其它生物特征的身份鉴别方法以及计算机人机感知交互领域都有密切的联系,并且人脸检测是人脸识别的基础和前提。目前,对于简单背景下的彩色图像人脸检测算法和实践已经比较成熟,现在市场上出现的人脸自动识别系统,大多要求标准是正向人脸和简单背景的条件,而对于复杂背景下的人脸检测,虽然提出了很多算法,但是始终没能建立一个通用且高效的,不能达到准确率和实时性的兼顾。首先,介绍了人脸检测的研究背景和意义,以及人脸检测中的难点和评价标准,最后则对彩色图像人脸的发展状况做了分析。其次,分析了人脸检测领域常用的RGB、YCbCr和HSV三种色彩空间中人脸肤色的聚类性,考虑到图像摄入时可能会有一定色彩偏差,所以采用了“参考白”的方法对图像进行了光照补偿预处理。然后综合考虑人脸肤色在多色彩空间的分布特性(聚类性),提出了YCbCr和HSV的混合肤色分割模型,并对肤色进行分割,最终得到人脸检测的候选区域。再次,研究了人脸定位的各种常用算法。然后针对传统SNoW算法具有占用资源多、执行效率低和鲁棒性差的特点,对图像亮度采用局部二值化映射算法进行改进,使像素的亮度只有16种可能值,大大节省了存储空间。最后用Yale人脸库结合局部均值变换(SMQT)训练SNoW分类器,训练中采用winnow规则更新。实验结果表明,人脸检测的准确率很高,能够检测单人和多人的各种情况,并且能够去除掉“类人脸”区域的干扰。接着,又研究了各种人眼定位的算法。通过分析,本文首先对Rein-Lien Hsu提出的灰度模型函数进行改进,然后结合色度模型组成的综合模型实现眼睛的粗定位。此次改进能够实现眼睛的粗定位,并能进一步弱化鼻了和嘴部的干扰,但是在定位中,也发现由于光照、人脸偏转等原因容易导致出现漏检的现象,针对此问题,本文又进一步利用Gabor变换对图像处理,再次定位双眼。Gabor变换中由于脸部尺寸的大小不一致,导致检测到的双眼位置在竖直方向上有一定的偏移。据此,依据第一次求得的眼睛的位置来纠正第二次定位的竖直偏移结果。实验结果表明,可以准确的实现对双眼的定位。最后,对比了各种嘴部定位的算法。本文首先利用唇色在YIQ色彩空间中的信息特征,筛选出嘴部候选区域,然后结合嘴部映射法,得到最大的嘴部映射函数值,即可确定嘴部的中心点位置。实验结果表明可以准确的实现嘴部中心的定位。未来人脸检测将会融合多种信息,检测的准确率和速度也将进一步的提高。静态图像中人脸检测技术的研究也将进一步推进动态检测技术的发展。