论文部分内容阅读
人脸活体检测随着人脸识别的普及显得越来越重要。人脸活体检测旨在判断摄像头前的人脸是真实人脸还是一张照片或者其他的欺骗型人脸。然而人脸欺骗手段的多样性对人脸活体检测系统提出了较高的要求。目前存在的人脸活体检测技术多数使用单一特征进行判断,导致其在准确性和鲁棒性上都有待提升,另外在保证模型性能的同时,人脸活体检测的计算效率也随着人脸识别应用的扩大越来越重要。针对以上问题,本文提出一种多模融合人脸活体检测技术并进行深入研究,在相关领域内前人的工作基础上,本文的主要研究内容与创新点如下:(1)在特征提取上,考虑到RGB颜色空间在图像分析中的局限性以及动态特征在人脸活体检测中的有效性,文中对HSV和YCb Cr颜色空间上的完整人脸与局部patch图像以及包含动态信息的时序图像进行特征提取。为了高效的利用这三种模态上的特征信息,我们提出以前端融合方式进行特征融合,并为此设计了一种多输入的融合网络。对于融合后得到的深度特征向量,文中结合残差结构设计了一种伴有高中低三种不同层级特征联合的决策网络对其进行迭代训练,并在决策网络中改进了原始的残差模块,通过添加1×1的卷积操作来增强网络的表达能力。最终在三个公开数据库上进行测试,测试结果表明了文中所提出的多模融合的方法优于现有的人脸活体检测方法。(2)针对人脸活体检测模型进行优化以提升模型速度。文中主要利用网络瘦身方法与基于通道剪枝的模型压缩方法来相结合来优化网络模型参数,对于网络瘦身主要通过输入简化与结构精简相结合的方式实现。在输入简化上,我们通过实验分离出能够提供更具鉴别力特征的通道图像,而后利用图像通道融合得到网络的输入图像。在精简结构上,合理地压缩网络结构并适度地减少特征图数量,依此来消减网络参数。最终通过实验证明,在此方案下模型参数被进一步压缩,模型速度大幅度提升并且模型依然拥有较高的准确率。