论文部分内容阅读
复杂背景,即存在遮挡、光照、模糊以及人脸不同姿态等干扰因素的背景。复杂背景中的干扰因素会导致人脸的特征变得不准确,使得复杂背景下的人脸检测研究变得十分困难。目前,越来越多的场景需要在复杂背景下进行人脸检测,比如无人驾驶汽车和国家反恐,这些需求使得复杂背景下的人脸检测研究具有重要的实际意义。同时,在理论研究上,复杂背景下的人脸检测研究是模拟人类视觉的关键研究,是实现赋予机器人工智能的重要组成部分,因此该研究也具有重要的理论意义。本文主要围绕着提升模型在复杂背景下人脸检测的精度和速度开展了以下工作:1)详细阐释了通用目标检测模型Faster R-CNN模型。Faster R-CNN模型在通用目标检测领域具有十分优秀的检测效果,尤其是该模型提出的RPN网络,能够生成高质量的候选区域,提高模型的检测效果。同时,该模型对检测小物体有较好的实验效果,而复杂背景下的人脸以小脸居多,因此,本文选用Faster R-CNN模型作为基础模型进行改进。2)本文提出了基于环境信息和特征融合的人脸检测模型。该模型使用残差网络作为特征提取器,提取用于分类和位置回归的特征,同时采用特征融合,使得用于分类和回归的特征具有更多的位置信息,提高模型对人脸的定位效果,最后模型对CMS-RCNN模型中提出的环境信息进行了改进,考虑到复杂背景下的人脸通常是处于非典型姿态,人脸身体比例会相应的缩小,本文通过实验得出,设定CMS-RCNN模型中的0.75倍比例。实验结果表明:模型取得较高的检测精度,同时,CMS-RCNN模型平均检测速度为1FPS,本文提出的模型获得了4FPS的平均检测速度。3)本文提出了基于Faster R-CNN模型的三分类人脸检测模型。使用Faster R-CNN模型作为基本模型,将人脸明确区分为小脸和正常脸,让模型对小脸更加关注,采用图片金字塔模式,增强模型对小脸的检测效果,同时采用了HR模型中设计的特征融合机制,提升模型的特征提取的效果。实验结果表明:相比于最先进的HR模型,本文提出的模型在检测精度上,十分接近HR模型,而在检测速度方面,HR模型检测时的平均检测速度为0.5FPS,而本模型的平均检测速度则达到了6FPS。