论文部分内容阅读
随着深度学习与计算机视觉的飞速发展,人脸识别技术在近十年中有了巨大的进步。目前,人脸识别系统在大规模人脸数据集上已经能实现超过人类的识别精度。尽管新的算法在不断刷新性能,但大多数人脸识别系统对伪装变化的人脸还是容易产生识别错误,这使得伪装成为人脸识别领域最具有挑战性的问题之一。由于公开的伪装人脸数据集的规模普遍偏小,目前的伪装人脸识别算法大多采用了两阶段式的训练方法:第一阶段使用普通人脸数据集训练一个用于一般人脸识别的神经网络,第二阶段则在第一阶段网络模型上基于伪装人脸数据集进行迁移微调。本文针对伪装人脸识别基于两阶段训练算法进行研究,主要贡献如下:(1)给出了国内外人脸识别领域的研究现状分析。首先,介绍了人脸识别的流程,重点包括损失函数、网络架构以及数据集;其次,分析了伪装人脸识别的现状、问题以及难点。(2)提出了一种用于伪装人脸识别的新训练算法。新算法基于两阶段迁移训练模式,第一阶段基于加性角间距损失函数来训练通用人脸识别网络模型,第二阶段利用基于三元组损失函数改进得到的联合损失函数在伪装人脸数据集上进行微调训练。鉴于通常配对训练时使用的三元组损失函数只限制了正样本对与负样本对之间的相对距离,缺乏正样本之间的距离约束,新算法提出的联合损失函数在三元组损失函数基础上增加了正样本之间的距离约束。所提新约束可以限制类内距离,同时使得训练收敛更快。在DFW测试集上进行的大量实验结果表明:在误识率为0.1%的条件下,所提算法在DFW的3个测试协议下准确度分别达到60.48%、82.88%、82.04%。(3)提出了一种新的分段间距损失函数,能同时用于普通人脸识别和伪装人脸识别训练。该损失函数分段融合了加性余弦间距损失函数以及加性角间距损失函数,具有两种损失函数的优点:也即可以在网络训练的开始阶段引导网络快速收敛,同时使得经网络映射的人脸特征向量与其在网络分类层所属类别的权重向量具有较小的夹角从而获得更小的类内距离以及更大的类间距离。实验结果表明:所提分段间距损失函数训练出的网络在LFW数据集和DFW测试集上的测试结果都优于加性角间距损失函数。(4)针对伪装人脸数据集规模较小导致的迁移训练过拟合问题,提出利用一般人脸数据集CASIA-Web Face、LFW与伪装人脸数据集DFW进行融合得到新的人脸数据集,并用于伪装人脸识别的迁移微调训练。实验结果显示:新的融合数据集改善了过拟合问题,并最终提升了人脸识别网络的性能。