论文部分内容阅读
计算机视觉技术的飞速发展使得人脸属性识别成为研究热点。人脸包含人类诸多生物学特征信息,包括性别年龄信息、身份种族信息、表情情绪信息等。其中,年龄信息作为人脸可以直接观测到的信息,是身份识别的重要依据之一,并且人脸年龄估计在人机交互、视频监控、图像视频智能分析等领域具有广阔的应用前景,所以基于人脸图像的生物识别研究成为热门问题,因此吸引了越来越多的研究人员的关注。过去几十年来,研究人员一直进行不懈的探索,并取得了大量的成果。由于人脸图像年龄的自动估计是一项很有挑战性的任务,受限于当时的条件,这些算法的性能仍然有很大的提升空间。近年来,深度学习在各个领域都有巨大发展,特别是在图像识别领域取得了突破性的研究进展。本文在前人研究的基础上,立足于深度学习理论,研究基于深度融合网络的人脸年龄估计算法。本文的主要研究内容如下:(1)调研了常用的人脸图像年龄估计算法,分别对特征提取方法和年龄估计算法两部分内容的研究现状进行介绍,在特征提取部分,详细总结了传统的特征提取方法和基于深度学习的特征提取方法;在年龄估计部分,解释了分类和回归两种估计方式的实现原理。介绍了评估一个年龄估计系统好坏的评价指标,并对比了各个年龄估计算法的优劣;(2)深入了解了深度神经网络的发展概况,并梳理深度学习的发展历程,列举了目前为止深度学习领域取得的一些突破性研究成果与实际性应用。此外,本文详细介绍了DBN、CNN的网络结构原理和训练方法,针对这两个具有代表性的深度网络做了一系列年龄估计实验,输入样本分别有原图和配准后的人脸图像,根据实验结果分析了这两个网络的优劣;(3)本文在已有的研究基础上,基于深度学习相关理论知识提出了一种端对端可训练的深度神经网络模型来进行人脸年龄估计。该网络模型由多个并行CNN和一个DBN堆叠而成,称为深度融合网络(Deep Fusion Network,DFN)。该模型首先使用多个并联的CNN提取人脸图像多个区域的外观特征,然后,将得到的特征进行串接输入一个DBN网络进行非线性融合;(4)本文为了实现DFN的端到端的整体训练,本文提出了一种逐网络迭代训练(Iterative Net-Wise Training,INWT)的机制。在特征提取过程中,因为有样本数量的限制,所以为了降低过拟合效应,对应人脸局部图像的CNN需要经过多次迭代迁移学习,才能完全拟合面向人脸年龄估计的任务。完成对DFN中所有CNN和DBN的预训练后,再进行全网络端到端的整体精调。最后,本文在两个人脸年龄图像库MORPH II和FG-NET上对本文方法进行测试,实验结果显示本文基于DFN的人脸年龄估计方法能在两个人脸图像库中分别取得平均绝对误差(Mean Absolute Error,MAE)等于3.42和4.14的估计精度。本文提出基于深度融合网络的人脸年龄估计方法与当前大部分基于深度神经网络的主流算法相比具有明显的优势。