基于深度学习的驾驶员分心行为检测

来源 :宁波大学 | 被引量 : 0次 | 上传用户:dfqq209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着车辆工业和世界经济的快速发展,汽车的数量不断增加,各种交通事故也越来越多。据统计,约五分之一的事故是由驾驶员在驾驶车辆中存在接电话、与乘客说话等分心驾驶行为导致的。交通安全问题已经成为全球关注的焦点,如何快速、准确地检测出驾驶员的分心行为,避免分心驾驶引发的交通事故是研究人员面临的一大难题。近年来,卷积神经网络(Convolutional Neural Network,CNN)凭借其突出的特征提取能力和较高的识别准确度,被研究人员屡次用于分心检测。然而,CNN模型庞大的网络参数量使得其训练变得耗时、困难,而且模型中卷积层数过多时容易产生过拟合、梯度消失等问题,对于实时分心检测常常力有不逮。为了解决上述问题,本文提出一种端到端的检测网络CNN-H(Convolutional Neural Network-HOG)。由于现有CNN模型只关注网络最后一层的输出特征,而中间层特征包含很多有用的颜色、边缘、纹理等信息,因此CNN-H模型提取了多阶段的中间网络层输出特征,并与方向梯度直方图(Histogram of Oriented Gradient,HOG)特征融合,丰富了网络用于决策的信息来源,使得CNN模型预测的结果更加准确。其模型参数量仅为3.6M,采用L2权重正则化(L2 Weight Regularization)、Dropout以及批归一化(Batch Normalization)提升网络的性能,使网络具有更强的鲁棒性。为了验证该网络的有效性,在两个公共数据集AUC Distracted Driver(AUCD2)和State Farm Distracted Driver Detection(SFD3)上进行了网络训练和测试。实验结果表明,在驾驶员分心检测准确度和实时检测性能方面,CNN-H模型能够达到令人满意的效果。虽然CNN-H模型获得了很不错的效果,但也存在网络不够精简(需要分为两路)、视野变化单一等问题。另外,用于模型训练和测试的原始图像,除去驾驶员本身的动作外,往往存在大量无用的背景噪声,这将对模型提取图像特征会产生很大的干扰。为了解决这些问题,同时满足实时检测的需求,在仅关注驾驶动作基础上,提出了一种基于递减卷积核的驾驶员分心检测网络模型DHCNN(Decreasing-HOG Convolutional Neural Network)。因为HOG图像可以有效地过滤掉大部分无用的背景噪声,只保留驾驶动作轮廓信息,所以我们对输入网络的图像都提取了HOG特征然后生成相应的HOG图像。D-HCNN模型首先使用较大的卷积核来确保网络具有较大的感受野,可以快速提取到驾驶员的动作信息。随着网络层的深入,采用线性递减的方式逐渐减小卷积核大小,使得网络在接下来的卷积运算中,进一步提取图像更微小、更抽象的纹理和边缘信息,从而获取到更加有效、更加深层的特征,同时也能够降低网络参数数量。在AUCD2和SFD3数据集上的实验结果表明,与现有很多论文的方法相比,DHCNN模型在减少参数量、提高准确度和实时性检测方面都取得了很好的效果。CNN-H模型主体特征是由CNN网络提取的,而HOG特征是作为辅助特征,这样设计是针对图片内容比较复杂的情况,而D-HCNN模型完全依赖HOG图像,适用于图片背景简单的情况。本文通过实验验证了两种模型的适用场景。在论文最后,我们还讨论和展望了分心驾驶评价指标、外界因素的结合、降低网络参数、应用目标检测等四个研究方向。
其他文献
随着集成电路的发展,芯片越来越接近工艺制造的极限,面对大数据量传输的需求的增加,以光为传输载体的光互连技术开始崭露头角,因其具有高速传输速率以及抗电磁干扰等优良特性,可突破电互连在带宽、功耗等方面的瓶颈。光逻辑器件是光互连中实现高速、大容量光信号处理的基础元件。其中,可逆逻辑器件因将输入与输出一一对应,能解决不可逆逻辑中因信号位丢失而引起的散热问题而备受关注。硅基光子技术可兼容现有互补金属氧化物半
学位
温度是生物研究中重要的指标,准确监测细胞在自然代谢过程中或药物刺激情况下的温度波动具有重要意义,能够为更深入的研究细胞在不同状态时的能量产生和扩散提供有意义的信息,对癌症和其他疾病的研究有一定帮助。采用荧光聚合物和热电偶探针等方法进行细胞温度测量存在测量精度低、细胞状态被干扰的局限性。本文研制的微芯片可用于监测微环境下的细胞温度波动,该微芯片由具有捕获功能的细胞培养结构和用于监测细胞温度波动的高精
学位
机械臂广泛应用于工业生产和社会生活的各个领域,传统的机械臂控制方法依赖于精准的环境模型,难以适应复杂的、未知的非结构化环境。近年来,随着人工智能技术的发展,结合深度强化学习的机器人控制技术有了长足的进步。深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)算法作为深度强化学习的经典算法,适用于连续控制问题,广泛应用于机械臂控制研究,但由于DDPG
学位
随着攻击技术不断发展,防御信息存储与传输所面临的各种威胁成为当今安全芯片领域的研究热点。物理不可克隆函数(Physical Unclonable Function,PUF)利用器件制造过程中固有的工艺偏差产生具有随机性与唯一性的数字指纹。攻击者难以通过常规攻击方式破解、克隆其中加密数据,可极大提高芯片的安全性。随着物联网技术不断更新,器件集成度不断提高,设备对能耗要求越来越高,极大限制PUF电路的
学位
面积和功耗限制了芯片性能的进一步提升,底层硬件的运算能力也不能满足日益增长的计算需求。与此同时诸多容错应用,如多媒体处理、数据挖掘和图像识别,也被越来越广泛的使用。在这样的背景下,人们提出了新的设计范式——近似计算。近似计算牺牲精度来换取电路性能的提升,可以为容错应用设计高效节能的系统。近似计算是指计算结果与正确结果之间存在偏差。近似计算技术应用到逻辑级优化电路的核心思想是人为引入一些错误输出来简
学位
随着人工智能时代的来临,对于芯片算力和功耗的要求日益提高。目前单片的晶体管密度已经达到0.9亿/mm~2,例如,英特尔基于IVY Bridge的四核芯片大约有十二亿个晶体管。设计这样异常庞大且复杂的电路无法依靠人力实现,必须使用自动化方式。电子设计自动化(EDA)是进行芯片设计所必不可少的工具,而标准单元库是使用EDA工具进行芯片设计的核心。当下主流的集成电路采用FinFET器件,目前FinFET
学位
随着“制造强国”战略的提出以及5G技术的广泛应用,与之相关的物联网技术得到了快速发展。然而,由于受到了电池寿命及更换电池困难等因素的影响,如何实现物联网各类传感节点的自供电已逐渐成为工业界和学术界广泛关注的热点话题。事实上,日常环境中存在丰富的射频能量信号源,大部分射频能量的发射具有全向性和全时段特性,会造成大量能量的浪费。因此,本文设计了一种基于射频能量收集的低功耗传感节点,可为传感节点的自供电
学位
SLAM(Simultaneous Localization And Mapping),即同步定位与地图构建,是机器人在一个完全未知的环境中解决定位、地图构建和导航的关键技术。SLAM系统通常由视觉里程计、闭环检测、后端非线性优化和地图构建等环节组成,其中闭环检测部分通过判断图像之间的相似性来解决位姿估计随时间的漂移问题,在SLAM系统中起到了重要的作用。传统的闭环检测方法大多采用人工设计的图像特
学位
深度学习技术已经在很多领域得到了广泛应用。与此同时,深度学习的安全性问题也随之而来,尤其是对抗样本问题。研究表明,目前大多数的深度学习模型容易遭受对抗样本的攻击。攻击者可以通过向正常样本添加细微的扰动,来生成高伪装性的对抗样本。深度学习技术的使用使语音识别技术更加高效与准确,帮助语音识别系统更好的理解用户,使语音识别技术真正走向了实用化。但对抗样本攻击的安全性问题,在目前主流的语音识别系统中仍然存
学位
随着当前信息时代的发展,神经网络以及机器视觉被开发的功能越来越多,并且在许多领域已经可以代替人类进行高精度以及高强度的工作。同时,随着社会经济的不断发展,越来越多的人选择长时间的坐姿办公模式,虽然长时间的坐姿办公显得轻松自在,但一系列日益严重的坐姿引起的疾患问题也随之而来,比如肌肉骨骼疾患、近视等。头部以及肩部姿态可以很大程度上反映人体坐姿状态。例如坐姿状态下的颈椎、用眼、手部、脊椎等情况。因此,
学位