论文部分内容阅读
人脸检测是进行人脸分析的第一步,其指的是判断给定图像中是否存在人脸,若存在则标记出人脸的位置。虽然传统的算法能够较好的检测出正面人脸图像,但由于肤色、表情、遮挡、光照等因素影响或在其他复杂环境下,并不能达到预期的效果。由于卷积网络能够自动提取特征,降低外在因素所带来的影响,越来越多的学者将卷积神经网络应用于人脸检测中。但大多数准确率高的算法网络层数都较多或使用复杂的级联结构,需要大量的训练时间,实际应用中难以实现实时检测。因此,本文基于卷积神经网络对人脸检测展开研究,提出了两种能够满足实时性而准确的算法,主要工作如下:
(1)提出了一种基于全卷积神经网络的多尺度人脸检测方法,针对网上支付、交通出行等特定应用场景能够快速而准确的完成单一检测任务。首先将卷积神经网络模型AlexNet、VGGNet和GoogleNet的全连接层改为全卷积层,实现图像任意尺度的输入以及减少训练参数;然后将分类层改为人脸与非人脸的二分类,训练之后准确率分别达到99.08%、98.99%和98.98%。最后将训练结果最好的分类模型用于人脸检测,待检测图片通过多尺度变换后输入全卷积网络可得到特征图的概率矩阵,再用非极大值抑制得到最精准的人脸框。检测结果表明,该方法在人脸检测时准确率高,检测时间短,表现出较好的性能。
(2)针对单一检测做出改进,提出了一种端到端的多尺度人脸检测,直接对人脸坐标进行端到端的训练。将图像划分为多个网格,分别在每个网格上用预测框检测人脸。具体工作如下:第一、在卷积神经网络训练时加入“对抗遮挡层”,用于对原图进行预处理以增强网络对遮挡情况的鲁棒性;第二、将普通卷积结构改为DL-CNN结构,提取更加全面的特征;第三、在第一层卷积与第二层卷积之间加入改进的inception结构,使得网络能够提取到不同层次的特征;第四、加入改进的空间金字塔池化层实现任意尺度图像的输入;第五、改进检测算法中常用的损失函数以提高模型的准确率。公开人脸数据集测试结果显示该方法能够提取人脸有意义的特征且性能优于许多有竞争力的人脸检测算法。
(1)提出了一种基于全卷积神经网络的多尺度人脸检测方法,针对网上支付、交通出行等特定应用场景能够快速而准确的完成单一检测任务。首先将卷积神经网络模型AlexNet、VGGNet和GoogleNet的全连接层改为全卷积层,实现图像任意尺度的输入以及减少训练参数;然后将分类层改为人脸与非人脸的二分类,训练之后准确率分别达到99.08%、98.99%和98.98%。最后将训练结果最好的分类模型用于人脸检测,待检测图片通过多尺度变换后输入全卷积网络可得到特征图的概率矩阵,再用非极大值抑制得到最精准的人脸框。检测结果表明,该方法在人脸检测时准确率高,检测时间短,表现出较好的性能。
(2)针对单一检测做出改进,提出了一种端到端的多尺度人脸检测,直接对人脸坐标进行端到端的训练。将图像划分为多个网格,分别在每个网格上用预测框检测人脸。具体工作如下:第一、在卷积神经网络训练时加入“对抗遮挡层”,用于对原图进行预处理以增强网络对遮挡情况的鲁棒性;第二、将普通卷积结构改为DL-CNN结构,提取更加全面的特征;第三、在第一层卷积与第二层卷积之间加入改进的inception结构,使得网络能够提取到不同层次的特征;第四、加入改进的空间金字塔池化层实现任意尺度图像的输入;第五、改进检测算法中常用的损失函数以提高模型的准确率。公开人脸数据集测试结果显示该方法能够提取人脸有意义的特征且性能优于许多有竞争力的人脸检测算法。