论文部分内容阅读
计算机视觉领域中,对人脸图像进行人脸检测与人脸关键点定位是一项具有重要意义的任务。人脸检测与人脸关键点定位是人脸图像分析的重要基础步骤,视觉场景中进行人脸检测并定位出人脸所在位置,根据人脸检测框图完成对人脸面部重要关键点位置定位,在人脸识别、表情识别、人脸属性分析等任务中有着广泛的应用。深度学习在图像处理问题中具有足够强大的特征提取和特征表达能力,本文采用深度学习方法提升非约束条件下的人脸检测检测率和人脸关键点定位精确度。人脸检测任务中,增加神经网络深度可以进一步提高神经网络对人脸特征的提取能力和非线性函数逼近能力。但是,在构建深度卷积神经网络的过程中出现了梯度消失和梯度爆炸问题,使得神经网络无法通过增加网络深度提高人脸检测器性能。非约束条件下的人脸关键点定位任务中,人脸外观和人脸关键点的位置呈现高度的非线性关系,尤其是在视频监控问题等实际应用中,人脸关键点定位的精确率还需要进一步提高。本论文主要针对人脸检测和人脸关键点定位问题进行研究,并针对以上问题提出了算法的改进,主要内容如下:(1)在人脸检测过程中,针对深度神经网络出现的梯度消失和梯度爆炸问题,本文提出了一种差值网络和二阶差值网络的神经网络微结构。该方法包括:设计可叠加的卷积神经网络微结构,使网络加深的同时避免梯度消失和梯度爆炸问题;采用一阶、二阶的差值方式设计跨越特征层融合更加复杂特征,进一步提高深度神经网络的特征表达能力。实验结果表明:差值网络和二阶差值网络解决了深度神经网络的梯度消失和梯度爆炸问题;通过增加网络深度,提高了神经网络的特征挖掘能力,进一步提升了人脸检测的检测率。另外,该网络结构在目标分类、识别过程中也有良好的表现。(2)针对非约束条件下人脸外观和人脸关键点非线性差异问题,本文仔细分析训练样本数据,有针对性的对公开数据集进行样本增强。丰富了不同场景下样本多样性,提高级联回归神经网络模型在非约束条件下的鲁棒性。同时,本文提出了一种改进的“由粗到精”的级联卷积神经网络结构,该模型包括:通过增加神经网络宽度在全局回归阶段增加多尺度特征融合,增强网络特征学习能力;提出一种针对神经网络回归问题的代价函数,在代价函数中引入一个可学习参数,进一步提升了神经网络解决回归问题的能力。实验结果表明:该网络结构以及相应的回归代价函数有效降低了人脸关键点定位的平均误差,提高了网络模型对非约束条件下人脸关键点定位的精确度,同时提升了神经网络收敛速度。