论文部分内容阅读
近年来,人工智能(Artificial Intelligence,AI)作为计算机科学的一个重要分支得到了学术界和工业界的广泛关注。人脸分析是人类日常生活中使用最为频繁的技能之一,赋予计算机感知、分析以至理解人脸的能力是实现人工智能的必经之路。自动人脸分析技术,包括人脸检测、人脸识别以及人脸属性分析等应运而生。人脸分析技术的相关研究具有重大的理论意义和应用价值,既可促进人类认知学领域和图像分析领域的研究,相关技术也被广泛地应用于公共安防、多媒体数据管理、娱乐服务等领域。人脸图像会受到光照、遮挡等环境因素和年龄增长、表情变化等自身因素的影响,给人脸分析相关技术带来了很大的挑战。遮挡、模糊等因素对人脸检测技术的鲁棒性提出了更高的要求。人脸类内差异性大,类间差异性小使得自动人脸识别需要提取具有强可区分性的特征。人脸检测技术无法提供用于人脸校准的人脸特征点,而人脸校准对人脸识别的精度有较大影响,因此非约束条件下精准快速的人脸特征点定位技术显得十分重要。随着深度学习(DeepLearning,DL)技术在计算机视觉、自然语言处理等领域取得巨大成功,深度学习技术特别是卷积神经网络(Convolutional Neural Network,CNN)逐渐被应用于自动人脸图像分析。本文主要研究深度卷积神经网络在人脸检测、人脸特征点定位以及人脸识别上的应用。具体研究工作如下:1.考虑到具体应用中通过摄像设备采集到的人脸图像存在模糊、遮挡等情况,在人脸图像中可能包含多个大小、疏密不一的人脸。本文提出了一种逐步训练策略,通过精心准备的训练数据训练深度卷积神经网络模型并对模型进行全卷积展开,使得最终的人脸检测器能够较好地检测任意输入图像中多姿态、模糊及被遮挡的人脸。另外,通过多模型融合和多尺度检测以应对集体自拍照中大小、疏密不一的人脸。在FDDB人脸检测标准测试库和网络上随机采集的集体自拍合照上的实验结果验证了该方法的有效性;2.人脸特征点定位作为人脸图像分析中基础而重要的一环,快速、精准的人脸特征点定位十分必要。本文在多任务卷积神经网络的基础上,提出了一种基于瘦长型多任务卷积神经网络的人脸特征点定位方法。“瘦”网络有效地降低了计算开销,“长”网络保证了非线性抽象能力,数据增强技术有效地降低了网络过拟合的风险,提高了网络的泛化能力。模型大小约为1M字节的网络能够在CPU上迅速、精准地完成人脸特征点定位任务,较好地适应移动端应用。在AFLW数据库上的实验结果验证了方法的有效性;3.受人类迁移学习机制和自顶而下视觉注意机制的启发,本文提出了一种基于迁移学习和专门学习的人脸识别网络(TS-Net)。通过可视化分析,根据源模型不同层的可迁移性有选择地将用于源任务(一般物体识别)的知识迁移到目标任务上(人脸识别),降低了训练复杂深度模型对海量数据和计算资源的依赖。本文融合了深度学习中的Leaky ReLU、批归一化等从全局和局部人脸块中学习专门用于人脸识别的知识。在LFW和CASIA-Webface数据库上的实验验证了 TS-Net所提取的原始特征、以及二值化特征在人脸验证和人脸辨识任务上的有效性。