论文部分内容阅读
随着人工智能技术的兴起和深度学习的迅猛发展,计算机视觉和模式识别领域成为了更加热门的研究领域,人脸识别技术在安防、教育、交通等方面有广泛应用。由于单一的人脸识别方法无法提供更丰富的头部信息,在存在遮挡、光线复杂环境等情况下,无法准确检测和识别,结合头部姿态的生物信息特征识别成了模式识别领域的研究热点。头部姿态估计研究的是计算出给定的视频或者图像中头部相对于相机的三个方位:仰俯角(pitch)、偏航角(yaw)和翻滚角(roll)。传统的头部姿态估计方法受自然环境因素影响,在复杂光照、局部遮挡等情况容易产生较大的误差。本文采用深度学习以及目标检测方法对头部姿态估计的算法进行研究和改进,主要工作包含下面三方面的内容:论述了卷积神经网络以及深度学习的原理、头部姿态估计整体流程以及常用的检测算法,包括人脸检测、人脸对齐和相机标注。同时,包括目标检测算法在人脸检测上两个改进方法的应用,以及后续的头部姿态解算原理。改进了一种多损失头部姿态估计方法。该方法主要利用更加深入的深度残差网络RestNet101进行特征提取,在训练阶段使用AdaBound算法进行梯度优化,最后进行多损失计算,用于细分类得到更加鲁棒的算法,在三个公共头部姿态数据集上实验,相比经典的算法得到了更好的估计效果,且能满足实时性。提出了一种基于多任务的细粒度头部姿态估计方法。利用多任务学习在图像处理方面的优势,将人脸检测、地标回归预测和头部姿态估计看作三个任务,来联合训练网络模型,使用VGG16作为骨干网络提取图像特征,使用细粒度模块对提取到的特征进行空间分组,用来得到更具代表性的特征,减少内存使用和无关计算量的消耗,最后得到头部姿态主任务的估计结果。在公共数据集上做了实验,对光照鲁棒性的表现较好,平均绝对误差比FAN等算法更低,是一种有效的头部姿态估计方法。