论文部分内容阅读
近年来,由于网络带宽和存储量的不断增加以及各种图形采集设备的迅速普及,互联网上涌现出数以亿计的人脸照片。人脸图像数量快速增长,对识别人的身份和属性(比如年龄、性别和表情等重要属性)提供了大量的训练数据。如何充分利用这些照片进行有效的人脸属性识别已经成为一个重要的热门研究课题。传统局部特征子,如Gabor滤波特征、局部二值模式(LBP)特征、生物仿生(BIF)特征等,虽然对光照、姿势和遮挡变化有一定的鲁棒性,但其描述能力和语义性有限,影响其在实际识别中的性能。近年来,随着GPU计算性能的突飞猛进,计算机的运算能力极大地增强,使得利用大规模图像数据训练复杂深度网络变得可行。2012年,Alex Net取得了Image Net比赛的第一名,此后深度卷积神经网络从此在图像识别的多个领域取得重要进展。在人脸相关识别任务上,深度卷积神经网络由于其优越的性能已经成为主流方法。本文主要使用深度学习中的卷积神经网络架构,研究非受控条件下人脸属性的识别方法,并开发人脸属性识别系统。本文从多任务学习的角度出发,设计或改进深度卷积神经网络CNN的结构以提高人脸属性识别的准确率,提出了三种基于深度学习的人脸属性识别方法,包括:(a)基于CNN和潜因子分析结合的年龄估计方法,该方法把潜因子分析嵌入到CNN框架中联合训练,新建的潜因子分解层能把卷积池化层的特征分解成年龄因子和身份因子,分解后的年龄因子用于估计年龄。该方法的贡献有:1.提出一个新的层:潜因子分解层结合CNN和潜因子分析算法。2.提出了基于年龄段的有序回归损失函数,和基于年龄值的有序回归损失函数一起优化。3.在MORPH album I,MORPH album II,FG-NET上该方法达到了较传统方法更好的性能。(b)基于多任务融合的性别和表情识别深度学习方法,该方法使用多窗格(patch)训练得出多个模型然后融合,并提出回归人脸关键点坐标任务和表情分类任务一起训练的识别方法。该方法在CVPR Workshop 2016上被使用,并取得了性别和微笑识别比赛、配饰检测与识别两个任务的第一名。(c)基于空间变换网络的人脸通用属性识别方法,该方法使用定位网络Lo-Net学习人脸对齐仿射变换中的参数,然后新建空间变换层把原始人脸图片对齐,进而送入分类网络Cl-Net分类人脸通用属性。该方法在Celeb A以及LFWA数据库上比其他方法平均分别提高了4%和2%。基于深度学习的人脸属性方法,提高了年龄、性别、表情和通用属性公开数据库上的识别性能,为人脸属性识别应用系统奠定坚实的基础。