论文部分内容阅读
随着人工智能和移动互联网的飞速发展,人脸检测和识别已成为计算机视觉领域的热门研究方向。随着近十年来移动智能手机的快速发展和广泛普及,人脸检测和识别技术已经被应用于手机端上的图像处理和身份认证识别之中。得益于深度学习在目标检测和图像识别领域取得的巨大性能提升,将深度学习应用于人脸检测和识别任务成为了很多研究人员的研究方向,并取得了优异的检测和识别成绩。目前深度学习的发展趋势是,通过在GPU上训练更深和更复杂的网络模型来获取更高的精度,然而,受限于移动端硬件的存储能力和计算能力,很难将规模庞大且计算耗时的深度学习模型应用于移动智能手机之中。因此,使用高精度、小规模、低延迟的轻量级深度学习模型进行人脸检测和识别成为本文研究的主要思路。在人脸检测阶段,本文使用多任务级联卷积神经网络MTCNN来实现。MTCNN网络由三个轻量级网络级联而成,利用面部特征点定位和人脸候选框边界回归之间的内在关联来提高网络的性能,可以从粗到细的方式进行人脸检测和人脸对齐。本文使用人脸数据集WIDER FACE和CelebA来训练MTCNN网络,并在人脸检测基准数据集FDDB上进行测试评估,当误检数目为500时,MTCNN的检测率达到了93.77%,超过了很多其他的人脸检测算法。将MTCNN应用于Android平台,在一加5手机上对尺寸为480×640的单人脸图像进行测试,平均检测时间为133ms,速度非常快。在人脸检测的基础上,本文使用轻量级深层神经网络MobileNets来提取特征进行1:1人脸认证识别和1:N人脸分类识别。MobileNets模型是基于深度可分解卷积构建的。深度可分解卷积将标准的卷积层划分为成一个深度卷积层和一个1×1点卷积层。深度卷积层中的卷积核个数和输入通道数目相同,每个卷积核只与输入的一个通道进行卷积。点卷积则对深度卷积的输出进行线性组合。通过分解可以大幅降低模型的大小和所需的计算量。本文在人脸数据集CASIA-WebFace上分别基于Softmax cross-entropy Loss和Triplet Loss来训练MobileNets模型,通过在人脸识别检测基准数据集LFW上进行测试评估,基于Triplet Loss训练的MobileNets模型取得了97.61%的认证识别准确率,在本文收集的10类人脸数据集上取得了97.50%的分类识别准确率,超过了很多的人脸识别算法和人类的人脸识别精度。此外,本文在以很低的精度损耗下,通过调节MobileNets的两个超参数,大大降低了网络的规模,提高了网络的运行速度。将MobileNets模型应用于Android平台上,在一加5手机上对尺寸为480×640的单人脸图像进行测试,当认证识别准确率为95.03%时,识别过程平均用时308ms,当分类识别准确率为96.27%时,识别过程平均用时179ms。识别速度很快,基本感受不到延迟,而且现在智能手机的迭代更新速度很快,每一代都会比上一代在性能上有大幅提升,因此,本文提出的人脸检测和识别模型具有广泛的应用前景。