基于图像识别的驾驶状态检测研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:liongliong537
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的增长,中国汽车保有量逐年递增,由此引发的道路安全事故也程增长趋势。疲劳驾驶和分心驾驶是引发交通事故中两个主要原因之一。研究驾驶员的驾驶状态,并适时进行预警,对于保证道路安全具有非常大的意义。基于机器学习的驾驶状态研究,主要是通过图像对驾驶员的脸部、头部或手部特征进行检测分析。其基于图像特征提取的驾驶监测技术与人的认知相似性,更因其非入侵式无接触性、强鲁棒性等特点,并可以与辅助驾驶设备/系统有效结合,使其在驾驶状态研究中具有巨大的发展潜力和良好的应用前景。在复杂的驾驶环境中,对于模型的检测速度和精度有了更高的要求。本文主要从以下两个方面对驾驶状态进行研究。首先,对于驾驶员的疲劳状态监测,主要从人脸图像上的眼部特征和嘴部特征开展研究,主要从网络结构和数据集进行改进。为了提高人脸检测中人脸姿态和大小的多样性,先使用LFPW和AFW带有关键点标注的数据集构建疲劳检测数据集,其数据集是在复杂环境下的人体上半身图片,数据的人脸大小、姿态和背景都很丰富,有效提升模型的鲁棒性。为了适应真实驾驶环境下的人脸区域的特征提取,使用YAW-DD疲劳驾驶视频扩充数据集,并使用CEW闭眼数据扩充闭眼特征。其次,根据数据集的统计特性调整网络结构,使模型更加紧凑。然后,使用改进的YOLOv3(You only look once v3)模型对人脸、眼部和嘴部特征进行检测,根据眼部的闭眼帧数和嘴部的哈欠帧数判定驾驶员的疲劳状态,并且通过检测出的人脸区域引入注意力机制,使检测的后帧根据前帧的人脸区域进行特征搜索,在保持检测速度的同时,提高了眼部和嘴部小目标特征的检查能力。最后使用通道剪枝技术对模型进行压缩,有效提升了模型推理速度,且有效减少了模型参数。其次,对于分心驾驶状态的研究,主要从对是否使用手机、是否饮水特征进行特征提取分析。使用手机是引起分心驾驶的主要因素,而引饮水作为另一个分心驾驶特征,以此提高模型的泛化能力,提高模型的鲁棒性;以双手紧握方向盘作为正常驾驶的特征。然后,改进YOLOv3模型为区域单一特征对三种特征进行特征提取,最后根据检测的最大置信度判别分心驾驶状态,模型使用的区域特征提取方法通过标签引入特征的位置信息,比其他基于整个图像特征的单一标签进行分类的方法更加有效。最后,通过剪枝技术对模型压缩,算法的检测速度和模型大小都有很大的改善。
其他文献
随着通信需求的快速发展及密集型无线数据业务爆发式地增长,低能耗、高容量以及高可靠的弹性传输能力为高速移动无线通信提出了更高的挑战。为了满足高速移动毫米波网络的高质量链路通信及高能效传输的需求,混合预编码技术及中继协作技术在保证传输链路稳定和提高系统能效方面优势显著。通过利用中继辅助通信网络来额外构建信息链路以弥补毫米波衰落损耗,并结合混合预编码技术进一步提升系统的容量及能量效率。基于此,本文主要聚
量子不经意密钥分配(Oblivious Quantum Key Distribution,OQKD)是量子密码学中基础而又重要的安全技术,是一种具有易实现、低开销、高安全性等优势的不经意密钥分配方式。量子隐私查询是对称隐私信息检索问题与量子密码学相互渗透的新型查询方案,旨在保护通信双方的隐私安全,它可以保护用户方的隐私,防止数据库拥有者在用户查询数据时窃取用户隐私,同样也能够保证数据库安全性,防止
人群拥挤集聚条件下的突发事件通常伴随着极度的拥挤和混乱,恐慌情绪和高度密集的人群以及周边环境中大量不确定的事件信息,可能使人群纷纷涌向某个既定的安全出口而导致严重的公共安全事故。如何在公共事件突发后迅速、安全的疏散拥挤区域的人群成为各领域的研究热点。然而,在缺乏及时通畅的信息传达渠道的情况下,大量人群聚集条件下的混乱环境给安全疏散技术带来了挑战,成为长期的问题瓶颈。移动互联网的普及为这一问题补齐了
第五代移动通信技术(The Fifth Generation Mobile Communication Technology,5G)满足了网络流量呈指数型增长的趋势。为了连接更多的用户设备和提供更高的数据速率,通过在宏小区范围内灵活部署低功率小基站以避免盲区,形成了超密集网络。在这种部署方式下,能够有效地提高网络吞吐量以及控制网络平衡。然而,基站的密集部署和移动用户的增加,导致网络中能源消耗和干扰
随着人工智能领域的快速发展,人们对产品的自动化程度要求也越来越高。移动机器人的发展给人们的工作和生活带来了极大的便利,其中能够完成自主导航和定位是在复杂环境中执行任务的前提,此时同步定位与地图构建(Simultaneous Location And Mapping,SLAM)技术的重要性得以体现,而视觉里程计(Visual Odometry,VO)作为SLAM系统的前端,是移动机器人完成自主导航和
铅锌矿石是战略性资源,广泛应用于各个工业领域,对于国民经济的快速发展有着举足轻重的作用。随着高品位矿藏的枯竭,铅锌矿石利用率需提高,铅锌矿石分选越来越受关注。通过铅锌矿石分选,富集铅锌矿石,提高利用率,矿山企业能够做到不浪费,绿色发展。针对利用卷积神经网络对矿石进行智能分选时,难以同时提高矿石分类精确度和处理量的问题,提出基于知识蒸馏理论的铅锌矿石图像分类方法。本文以基于X射线成像技术的铅锌矿石图
油茶是一种可生产食用油料的茶树,其树根、叶片、茶籽以及茶壳都具有良好的生态经济效益。但是随着油茶种植面积的不断增加,各类侵害油茶树的病害也越来越多,其中油茶炭疽病是油茶产业普遍发生的一种破坏性极强的病害,而且目前也没有研制出有效的防治药剂,严重地影响了油茶产业的发展。因此及时准确地检测炭疽病,对油茶产业健康持续发展具有重大意义。本文提出了利用激光诱导击穿光谱(LIBS)技术,研究炭疽病油茶叶片中营
现今,随着无线通信技术的发展,从开始的1G到现在的5G出现,通信频段越来越细化的同时,对无线终端也提出了更高的要求。终端会向多功能、高性能、小型化等方向发展。然而对性能要求越高,其设备结构让电路会更加复杂,体积如何保持不变甚至进一步小型化成为难题,单凭射频前端的无源微波器件设计,无法满足现在的需求。滤波器和天线的一体化设计,能够使设计出的滤波天线不仅具有辐射、滤波、平衡变换等功能,还可以满足系统集
自然场景下的文本检测与识别技术已成为近年来一个非常热门的研究课题。一方面,作为自然场景中文本信息提取的基础,自然场景下的文本检测与识别方法具有很高的研究价值;另一方面,在包括图像搜索、即时翻译和机器人导航等领域内的诸多应用场景中,高性能的文本检测和识别系统也有着重要的现实意义。针对现有的文本检测和识别方法中的不足。本文的研究主要有两个方面:一是研究满足自然场景中多方向、不规则文本的检测算法。二是如