基于深度学习的驾驶员手持通话状态检测方法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:LogiCrown
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行车途中驾驶员的手持通话行为会严重分散其注意力,使得发生道路安全事故的风险比正常驾驶时高4倍以上。目前,国内外学者针对驾驶员手持通话这一特定行为状态检测的研究还比较少,主要集中在基于非视觉和基于视觉的检测研究上。而近年来随着深度学习的迅速崛起,其基于卷积神经网络的自动学习特征、高准确率和强鲁棒性等特性给图像分类、目标检测和目标跟踪等领域带来了新的曙光。本文将基于深度学习的目标检测方法应用到交通领域的驾驶员手持通话状态识别的研究中,其中重点基于区域提案的目标检测方法展开研究。主要研究工作如下:首先,构建驾驶员手持通话状态数据集。本文采集来自比特达交通运营平台上的实时视频数据,将这些视频数据转换为连续视频帧,并通过镜像的方式进行扩增,创建实验所需数据集。在实验前将数据集统一整理为VOC2007数据格式并划分为训练集和测试集,然后利用LabelImg图像标注工具对训练数据集进行分类和标注,形成标注文件,以便后续网络的训练和测试使用。其次,提出了一种改进Faster R-CNN的手机物体检测方法。针对大量背景噪音以及明暗变化对图像的影响,通过数据增强的方法对图像做简单预处理。引入扩张卷积的思想,改进残差结构并融入到检测子网络部分,缓解输入图像经过特征提取后特征图逐步变小的问题。采用四步交叉的方式训练改进后的Faster RCNN检测模型并设置对应的多任务损失函数,最后通过实验对比改进前后模型的性能。实验表明,改进后的检测模型准确率达到了91.42%,相较于原模型图像的检测精度得到了有效的提升。最后,提出了一种基于策略融合的驾驶员手持通话状态检测方法。在改进的网络结构的基础上,融合不同的优化策略分别减少漏检测和误检测的情况。其中,设计合适的锚框策略并采用多尺度训练的方式减少漏检测情况;接着在网络模型中引入OHEM(Online Hard Example Mining)策略,通过多次反复训练困难负样本,增强网络对困难负样本的识别能力,从而减少误检测情况。最后通过多组对比实验选取适合本文数据集的超参数(随机失活值、批处理大小和置信度阈值),进一步优化检测性能。实验表明,策略融合后的检测模型性能得到了进一步的提高,在保证实时的同时性能提升了3.26%。该论文有图29幅,表12个,参考文献82篇。
其他文献
边缘检测是图像处理中的关键技术之一,在生物医学、医疗设施、工业检测、机器人视觉等领域都有着广泛的应用。提取精确且完整的边缘对整个图像处理的后续工作,都具有十分重要
大气颗粒物污染和降水酸化日益严重,已成为当今的两大环境问题。大气颗粒物与酸性降水之间相互作用相互影响,它们之间的关系探索也是目前国内外研究的热点之一。为了探究近郊
复杂辐射环境下集成电路的高可靠性、低成本、短设计周期以及长久的使用寿命一直是微电子领域的研究热点之一。本课题应用180nm工艺的抗辐射加固标准单元库,完成MCU芯片的RTL
化学技能性知识是化学知识内容的重要组成部分、是学生掌握和应用化学的基础,如果学生不能熟练地使用化学用语,没有形成必备的化学实验技能和化学计算技能,必然会产生化学学
无线自组织网络是由一组使用无线电作为通信信道的移动节点组成的网络。它是一个以独立方式配置、组织和控制的自治系统。网络中的节点由能量有限的电池供电,如果节点耗尽电
甲基叔丁基醚(MTBE)对汽油具有良好的调和性能,调和比例可达15%,其质量对汽油质量升级具有重要意义。尽管美国、欧洲和亚洲的一些国家禁止或限制MTBE作为汽油添加剂使用,但其在
《中国教育现代化2035》提出了面向教育现代化的十大战略任务,在发展中国特色世界先进水平的优质教育任务中要求创新人才培养方式,着重培养学生创新精神与实践能力。批判性思
现场可编程门阵列FPGA因其资源丰富且可重配置的优点常常应用于实验环境中数据采集系统的设计。然而在粒子物理实验环境中,由于重粒子碰撞作用产生的电离辐射,工作其中的电路
蛋白翻译后修饰调控信号转导、酶活性、蛋白质定位、识别和降解等过程。组蛋白翻译后修饰不仅可以调控DNA与蛋白的结合水平,影响DNA复制和转录,还可调控染色质结构的转变。组
现代社会高速的发展,不可避免的对生态环境造成严重污染。抗生素的问世,虽然为人类治疗疾病做出了卓越的贡献,但由于抗生素在各行各业的监管政策较松而存在严重地滥用,使人类