论文部分内容阅读
随着计算机、互联网、海量存储等信息技术的飞速发展,身份鉴定技术在现在社会中的地位更加凸显,信息安全的作用也越来越重要,如何快速有效地进行身份鉴定,成为深度学习研究的一个重要方向,而人脸检测与人脸识别是身份鉴定技术中重要的方式之一。Hinton教授提出深度学习理论之后,得到了学术界的普遍关注,越来越多的学者利用深度学习去解决人脸检测与识别的问题,深度学习中的卷积神经网络模型是最常用于人脸检测与识别的模型。本文通过分析CNN模型对图像特征的表达特性,构造了一个CNN网络模型,该模型在传统的VGG模型上加以改进,本文的工作主要有:1.通过对Faster R-CNN算法的深入研究,在RPN网络模型的基础上,采用固定尺寸分割策略代替滑动窗口,给出了一种改进的RPN网络模型。RPN网络模型通过滑动窗口的方式在最后一层卷积特征图上进行穷举,由于滑动窗口的大小是固定的,且会产生较多的窗口冗余,所以本文采用固定尺寸分割策略代替滑动窗口,从而可以产生更多尺寸的目标估计,对极端情况的人脸图像有很好的检测结果。2.采用空间金字塔池化技术(SPP)解决了VGG网络模型输入图像尺寸限制的问题。在对VGG网络模型训练前,如果输入的人脸图像样本不符合VGG网络模型的要求,就需要对人脸图像进行缩放,而缩放处理会造成一定程度上的图像形变,可能会导致图像空间信息的损失。针对这个问题进行研究发现,是因为全连接层要求输入的维度必须是固定不变的,从而在VGG网络里引入了SPP,将卷积层和全连接层连接起来,从而不再限制输入的图像大小。SPP池化技术可以提高图像提取的特征的表达能力,进而可以提高VGG模型对人脸识别的准确率。3.设计并实现了一套基于Faster R-CNN算法的人脸检测与识别软件,该软件测试结果表明,可以达到较高的检测率和识别率,而且对于不同姿态和表情的人脸检测与识别,具有较强的鲁棒性。实验测试结果表明,基于改进的VGG模型对于人脸识别的准确率达到了99%。