论文部分内容阅读
随着人脸识别和人证核查系统的广泛应用,为了避免其遭受照片或视频的欺骗攻击,人脸活体检测成为人脸识别系统中的关键技术。然而,现有的人脸活体检测方法在视频攻击和复杂自然环境下的效果并不理想。卷积神经网络(Convolutional Neural Network,CNN)具有强大的表示力,能学习到图像空间上的深度特征。长短期记忆网络(Long Short-Term Memory,LSTM)是一种时间递归神经网络,能学习到视频时序上的深度特征。生成式对抗网络(Generative Adversarial Network,GAN)是一个由生成模型和判别模型构成的深度学习模型,提供一个对抗式的训练过程,从而获得具备判别性的空间特征。本文结合三种网络的特性,利用多特征、时空特征和隐空间(Latent Space)特征对照片和视频攻击进行人脸活体检测。本文的主要研究内容包括:(1)对现有的人脸活体检测方法进行深入研究,分析、总结使用单一特征的弊端,即其仅对单一情况下的攻击方式有效;从现有的11个公开数据库上分析攻击人脸与真实人脸间的差别,利用两者本质上的差异,对人脸活体检测方法进行研究。(2)使用CNN从人脸图像的不同线索中学习多个深层特征进行人脸活体检测。结合三帧时序特征、颜色空间特征和随机取块的局部特征等三种不同特征进行分析,在三个公开数据库上评估方法的性能,并证明此方法的可行性。(3)使用CNN+LSTM的网络结构,从人脸动态图上学习长短时空特征,并利用整张人脸和局部人脸区域(眼睛、鼻子、嘴巴)提取时空特征。然后将全局特征与局部特征融合,来获得更好的性能,并跨数据库评估算法的性能。(4)通过GAN重构人脸图像,使得网络中间层的特征即隐空间特征能够表示原始图像的空间分布,然后融合其中间层的隐空间特征,进行分类;并对比几种常用分类方法的实验效果。最后,在三个数据库上对该方法进行评估。