论文部分内容阅读
近年来,随着互联网技术与计算机硬件的飞速发展,人脸表情识别技术已经应用在很多领域中,比如人机交互、驾驶员疲劳检测等。人脸表情识别是一个跨多学科的研究领域,有很多复杂的场景都会影响到识别的准确率,比如旋转、偏移、光照。由于很多传统的识别方法难以满足现在的实际需求。一些优秀的传统方法,都需要由人工来设定提取特征的一些信息,很容易造成考虑不完善,从而造成信息丢失,很难做到准确的识别。而卷积神经网络对于图像数据的处理有很大的优势,并且对于人脸表情的微妙变化,通过卷积神经网络的不断学习更新来提取面部特征,可以得到很多更深层次的特征。本文基于人脸表情识别算法,进一步研究人脸表情识别在智能辅助驾驶中的应用。故针对上述问题,本文主要提出了一种基于深度卷积神经网络的人脸表情识别算法。本文的主要研究内容如下:1.针对人脸检测过程中主体的高变化性,且驾驶环境下复杂的影响因素以及光照因素,传统的人脸检测方法很难实现快速且精准的人脸检测与定位。本文设计一个三层级联的卷积神经网络用于人脸的检测与定位。通过三个不同结构的卷积神经网络,第一阶段通过浅层网络粗略定位人脸位置,第二阶段再对第一阶段的数据进行进一步精简,最后第三阶段去除所有的非人脸数据,最终精确的定位人脸所在位置,可以避免因复杂环境等因素造成的识别率低的问题。本文通过FDDB人脸数据验证,实验结果表明,该方法对于人脸的检测准确率有一定的提升,并且具有较强的鲁棒性。2.对于数据驱动型学习算法,数据集是重中之重,对于疲劳表情的数据集常用的有Yaw DD和CEW,但该数据集只针对单一的状态进行采集并构建数据集,且数据集中大多数为欧美人脸,不符合本文针对打哈欠和打瞌睡同时检测的要求。故本文通过模拟真实驾驶环境,自采数据集来训练特征提取网络。3.不同人脸的不同表情会表现出巨大的差异性,现有学习算法的特征提取是以人工设定的特征为基准来提取,损失了原图像很多细节特征,无法做到高效、实时的表情分类。故本文设计了一个多尺寸卷积的深度卷积神经网络,通过多尺寸卷积可以做到对不同的特征尺度满足不同的需求,同时避免了人工设定特征点的不充分问题。并且为了避免网络过于深入导致的模型运行速度变慢的问题,本文研究了神经网络的参数压缩技术,最后通过GAP代替传统的全连接层,在基本不影响精度的前提下,大大降低参数量。实验结果表明,该算法可以在一定程度上提高识别精度和运行速度。