论文部分内容阅读
随着科学技术和社会经济的快速发展,汽车已经成为人们的基本出行工具,高发的交通事故不断威胁着全世界人民的生命财产安全,疲劳驾驶正是主要“元凶”之一,而现有的疲劳驾驶检测算法大多采用人工设计的特征表示人脸,其特征表示及预测分类可靠性差、计算量大、准确率低,难以推广到现实应用中。深度神经网络通过对像素级原始数据进行多层次非线性变换,得到抽象的高层语义概念特征信息,表现出强大的学习能力和高效的表达能力。这对图像的全局特征和上下文信息的提取带来了极大优势。这为解决一些传统的计算机视觉问题,如关键点检测、人脸识别、图像理解等,带来了新的思路,并得到极大的关注。针对以上问题及深度学习取得的巨大成功,本文通过分析研究各类疲劳驾驶检测技术的优缺点,运用深度学习和迁移学习的技术,设计了三种基于深度学习的疲劳驾驶检测算法,具体的研究工作如下:(1)针对传统的机器学习算法提取人工设计的疲劳特征表示能力差、鲁棒性低、预测分类可靠性低的问题,本文运用深度神经网络非线性变换能力强的特点,将深度神经网络模型应用到眼睛的疲劳特征表示中,提出了基于卷积神经网络的眼睛疲劳特征学习模型,该模型使用了基于三元组的损失函数,以缩小类内距离、扩大类间距离,增强特征的区分能力,并在CEW和ZJU数据集上验证了其有效性。(2)针对使用HOG(Histogram of Oriented Gradient)进行人脸检测,再利用ERT(ensemble of regression trees)进行人脸关键点定位精度低、实时性差的问题,本文利用人脸的内在相关性和深度网络特征学习能力强的特点,借鉴级联滤波器逐步求精的思想,提出基于级联卷积神经网络的特征定位模型,通过一个三阶级联的网络实现由粗到精地进行疲劳特征点定位,并在300-W和CEW数据集上验证了该模型的有效性。(3)深度学习模型大、参数多,因此需要大数据才能发挥它极强的学习能力。针对目前缺乏足够大的眼睛睁闭标记数据集,限制了深度学习方法学习能力的问题,本文使用迁移学习的方法,将深度神经网络在大型人脸数据集中学习得到的人脸模型,迁移到人眼数据集中,借鉴模型在人脸数据集中学习得到的大量知识进行眼部疲劳特征的学习,最后融合眼部疲劳特征和嘴部疲劳特征进行疲劳驾驶的检测,在CEW和YawDD数据集上的大量实验验证了该模型的有效性。