论文部分内容阅读
近年来随着深度卷积神经网络(deep convolution neural networks,DCNN)的引入,人脸识别的准确率得以跨越式提升,各类相关应用如人脸识别考勤,考生身份验证,刷脸支付,人脸归类查询等已开始逐步投入使用,效果显著。然而现实场景中非限定条件的人脸识别技术却存在较多难题,例如姿态、光照、遮挡等困难,识别精度也随着数据规模的增加和识别难度的增大而快速下降。目前的解决方案是通过增大复杂场景下的训练数据库规模来学习到尽可能多的场景。然而大多数大型的数据库(百万级)由私人公司持有且不公开,即使目前公开的大型数据库,也由于标注信息过少、准确性得不到较好保证,会影响DCNN的训练。本文从确保训练数据库的准确性和解决部分姿态问题出发,主要做出了以下工作:本文首先深入了解了深度学习的部分理论知识,总结了当前主流的深度学习开源框架和人脸识别开源项目以及国内当前主流人脸识别相关公司和解决方案。通过检测误差、检测效果和效率以及在大规模数据上的稳定性的实验对比分析了当前主流的人脸检测算法的性能,并根据实际情况提出了检测评价机制减少误差,最终选择针对大规模数据进行处理综合效果好的算法,提出了基于关键点映射的人脸图像归一化算法。针对大规模数据库准确性无法保证、存在噪声等问题,提出了基于多角度评价的数据清理方法,在同一个类别中每张图像与其他图像进行相似度计算,并统计与该图像不相似的图像数量,超过一定的数量就对该图像进行清理。通过多方面的实验验证了清理数据方法的有效性。实验证明,清理后的数据库训练模型在LFW数据集上的准确率得到了提升,以较小规模的训练集取得了 99.17%的准确率,在Youtube数据集取得了 93.54%的准确率。为了解决非限定人脸识别中的多姿态问题,使用基于三维人脸模型的图像校正生成正面图像,并提出了将正面合成图像提取的特征与原始图像进行特征线性融合的方法来生成新的特征向量。合成正面图像能提供原始图像不具备的特征,也存在信息丢失,而原始图像的特征具有较高的参考价值,因此融合二者特征的新特征具有更全面的特征。实验证明,新的特征向量能够有效提高人脸识别率,将原有的LFW上50对错误匹配对矫正了 15对,在SWJTU-MF DB上也取得了显著的效果。