论文部分内容阅读
人脸识别技术是生物识别技术中最广泛的应用之一。传统的人脸识别技术通常由采集和处理两个模块组成,采集由部署在对应场地的摄像头完成,而处理则是由强大计算力的服务器端来进行。在这种工作模式下,通常一台服务器需要支持多路的摄像头输入,而随着现在摄像头数量的剧增,依靠中央服务器来进行处理的方式越来越难以扩展。同时当前使用的人脸识别技术普遍建立在深度学习的框架之上,深度学习网络虽然拟合能力强,但是同时也面临着计算量大的问题,如何将基于深度学习的人脸识别技术控制其计算量并部署到端上的系统中,成为一个急需解决的课题。在考虑计算量和运行内存的情况下,同时尽可能地提升识别系统的性能,是本课题的主要研究目标。在对于深度学习的计算量庞大的问题上,当前学术界也在积极的探索并设计轻量级网络,由于针对计算机视觉问题的深度学习主要依赖于卷积网络,而卷积操作的计算量占网络的绝对主导,因此如何减少卷积操作的计算量是轻量级网络的主要研究方向。目前已有一定的针对物体分类的轻量级网络,本课题基于这些轻量级网络,改进其并用于人脸识别任务中,用以探索人脸识别场景下的轻量级深度学习方案。朴素的直接训练轻量级卷积网络,会由于其的模型容量小,训练难度高而使得模型的性能相比大模型差的很多。本课题针对这个现象,采用知识蒸馏和深度互学习两种方案用以减少模型的训练难度,增加模型对于人脸识别任务的泛化能力。基于知识蒸馏的方案要求我们预先训练好一个大网络,并将大网络的知识传递给小网络,以减少小网络直接从训练集的标签学习的难度。而深度互学习是需要我们构建多个小网络,使用多个小网络联合学习的方式互相弥补不足,从而在摆脱大网络依赖的情况下仍然能够提升一定的性能。本课题基于基于两种方案将轻量级网络的识别准确率在多个数据集上提高2%。在人脸识别任务中,对于大角度的识别一直是难以克服的问题。对于轻量级网络来说,从正脸识别转换到侧脸识别,性能下降相比大网络的更加厉害。本课题针对轻量级网络的侧脸识别准确度问题,提出一套基于WGAN-GP的多任务对抗生成网络框架,基于该网络框架同时在基于蒸馏的方案的基础上在多个大角度测试集上又提升了约2%的性能。