基于改进YOLOv3的人车信号灯识别方法研究

来源 :交通科技与管理 | 被引量 : 0次 | 上传用户:gordontang530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:目标检测是计算机视觉中的一个关键任务,其中YOLOv3算法检测速度较快,但存在边界框定位不准,且对小目标检测精度不高的问题。针对以上问题,本文提出了一种基于改进YOLOv3的人车信号灯识别方法,以获取自动驾驶中所需要的道路交通信息。本文基于Apolloscape数据集中的视频或图像,首先通过K-means聚类计算获得新的anchors值,替换原始YOLOv3模型中的数据集参数,并利用高斯分布特性增加对边界框准确度的判断,再采用改进后的YOLOv3模型对行人、车辆和信号灯等道路交通信息进行检测,实现了端对端的运动目标检测,实时性良好。实验结果与仿真数据呈现出良好的一致性,研究结果表明,相比于原始YOLOv3模型,本文提出的改进的YOLOv3算法具有实时性强、精准度高等优点,在准确度、召回率和平均IOU值上均有提升。
  关键词:人车信号灯目标检测;YOLOv3;K-means聚类;深度学习
  中图分类号:U491.5 文献标识码:A
  0 引言
  全自动驾驶是汽车工业未来的发展方向,国际自动机工程师学会根据智能程度将自动驾驶分为L0-L5共六个级别。其中辅助驾驶相当于L1和L2级的自动驾驶。多种辅助驾驶技术已经被广泛应用,其应用能力和操作权限也处于逐步提升阶段,但由于技术和成本的限制,完全无人驾驶尚处于实验和验证阶段。
  随着社会发展,自动驾驶成为当前热门话题之一。自动驾驶系统首先需要获取道路交通信息,主要有浅层学习和深度学习两种方法[1]。浅层学习主要依据模板与图像稳定的特征点获取模板与场景中对象的对应关系来检测目标,使用Canny[2]和粒子群SVM[3]。近年来,基于卷积神经网络的深度学习得到迅速发展,主要分为两类:一类是基于R-CNN算法,需要先使用启发式方法(selective search)或者CNN网络(RPN)产生Region Proposal,然后再在Region Proposal上做分类与回归,虽然精度很高,但速度非常慢。另一类是基于YOLO(You Only Look Once)[4]、SSD(Single Shot Multi-box Detector)[5]这类算法,其仅仅使用一个CNN网络直接预测不同目标的类别与位置。本文检测行人、车辆和信号灯所用到的改进YOLOv3算法结合了特征金字塔,借鉴了残差网络和多尺度预测网络,从而表现出较好的目标检测速度和精准度。这使得此方法在自动驾驶中的应用具有良好的前景。
  1 概述
  本文提出了一种基于改进YOLOv3的人车信号灯识别方法,以解决原始YOLOv3算法存在的边界框定位不准,且对小目标检测精度不高的问题。本文基于Apolloscape数据集中的视频或图像,首先通过K-means聚类计算获得新的anchors值,替换原始YOLOv3模型中的数据集参数,再采用改进后的YOLOv3模型对行人、车辆和信号灯等道路交通信息进行检测,可应用于自动驾驶或车辆辅助系统。目标检测流程图如图1所示。
  2 YOLOv3算法原理
  本论文所使用的YOLOv3的网络结构如下图2所示,Darknet-53作为骨干网络主要用于提取图像特征,它是全卷积网络,包含有53个卷积层,引入了残差结构。输入为416x416时,Darknet-53特征提取网络将输出三个尺度的特征图,大小分别为13x13、26x26和52x52。将三个不同尺度的特征图通过FPN(Feature Pyramid Network)[6]进行融合,利用多尺度策略帮助网络模型同时学习不同层次的特征信息,最后将融合后的特征输入YOLO层进行类别预测和边界框回归。
  YOLOv3采用先验框(anchor box)机制来预测目标边界框,对标注边界框尺寸进行K-means聚类得到一组尺寸固定的初始候选框。先验框尺寸与特征图尺度大小成反比,在较大的特征图上应用较小的先验框,用于检测较小的目标,在较小的特征图上应用较大的先验框,用于检测较大的目标。对于输入图像,YOLOv3按特征图尺度将其划分为S×S个网格,每个单元格会预测B个边界框(bounding box)以及边界框的置信度。所谓置信度其实包含两个方面,一是这个边界框含有目标的可能性大小,二是这个边界框的准确度。前者记为Pr(object),当该边界框是背景时(即不包含目标),此时Pr(object)=0。而当该边界框包含目标时,Pr(object)=1。边界框的准确度可以用预测框与实际框的交并比来表征,记为IOUtruthpred。因此置信度计算公式为:
  得到全部预测边界框后,设置阈值将置信度较低的边界框去除,其余边界框经过非极大值抑制得到目标边界框。
  3 改进的YOLOv3算法
  若两个目标类别均值之间的距离小于预先设定的阈值,则将这两个目标类别合并为一个类;再继续通过上式计算类均值的距離。经过对样本子集的并集进行合并,得到最终的K-means值聚类结果;使用最终生成的聚类结果计算符合本模型使用的anchors值,将新的anchors值替换原始YOLOv3模型中的数据集参数。
  在YOLOv3损失函数中利用高斯分布特性增加对每个边界框准确度的预测,以提升网络的精度,YOLOv3算法的损失函数主要从边界框坐标预测误差、边界框置信度误差、类别预测误差这三个方面考虑,其损失函数公式表示为:
  其中,S表示图像的网格数,B表示每个网格中预测的边界框数,C表示总类别数,P表示目标属于某一类别的概率,c为类别序号,S2为网格序号,B为边框序号;xi表示属于第i个网格的边界框中心点的横坐标,yi表示属于第i个网格的边界框中心点的纵坐标,wi表示属于第i个网格的边界框的宽度,hi表示属于第i个网格的边界框的高度,λcoord为权重系数,λnoobj为惩罚权重系数,表示第i个网格的第j个边界框是否负责预测这个目标。   利用高斯分布特性改进损失函数,增加对边界框准确度的判断,以边界框中心点x方向坐标为例,修改后的边界框x坐标预测误差计算方法如下式:
  式中,tx表示边界框中心点坐标相对于网格左上角x坐标的偏移量,W和H分别表示预测层中网格的数目,K表示先验框的数目。
  4 实验结果分析
  本文实验环境为1080ti gpu服务器,CUDA版本是10.0,tensorflow版本是2.0,keras版本是2.3,数据集选取的是Apolloscape数据集。Apolloscape发布的整个数据集包含数十万帧逐像素语义分割标注的高分辨率图像数据,涵盖了更复杂的道路状况,同时开放数据集采用了逐像素语义分割标注的方式,是目前环境最复杂、标注最精准、数据量最大的自动驾驶数据集。通过本文改进的YOLOv3模型得到的目标检测结果如下图3。
  从图3中,我们可以看到,本文对图像中的行人、车辆和信号灯的识别检测结果表现良好。目标检测结果图中,可以得到行人、车辆和信号灯的类别和置信度,并用不同的颜色标出。在车辆检测中,本文将车辆按车型分为三类进行识别:小车car,卡车truck以及公交车bus。
  为了定量评估本文提出的基于改进YOLOv3的人车信号灯识别方法在性能上的优越性,实验使用相同的数据集进行训练与测试,最终得出各项性能测试结果如下表1。相比于原始的YOLOv3模型,本文提出的改进的YOLOv3模型在准确度、召回率和平均IOU值上均有提升。
  5 结论
  本文提出了一种基于改进YOLOv3的人车信号灯识别方法,以解决原始YOLOv3算法存在的边界框定位不准,且对小目标检测精度不高的问题。本文基于Apolloscape数据集中的视频或图像,首先通过K-means聚类计算获得新的anchors值,替换原始YOLOv3模型中的数据集参数,并利用高斯分布特性增加对边界框准确度的判断,再采用改进后的YOLOv3模型对行人、车辆和信号灯等道路交通信息进行检测,可应用于自动驾驶或车辆辅助系统。目前的工作对信号灯的检测较为单一,还未实现对信号灯指示方向的判断,相关研究将在后续研究中进一步展开。
  参考文献:
  [1]马立,巩笑天,欧阳航空.Tiny YOLOv3目标检测改进[J].光学精密工程,2020,28(04):988-995.
  [2]丁鹏,张叶,刘让,等.结合形态学和Canny算法的红外弱小目标检测[J].液晶与显示,2016,31(08):793-800.
  [3]张国梁,贾松敏,张祥银,等.采用自适应变异粒子群优化SVM的行为识别[J].光学精密工程,2017,25(06):1669-1678.
  [4]Redmon J,Divvala S,Girshick R,et al.You only look once: unified,real-time object detection[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2016:779-788.
  [5]Liu W,Anguelov D,Erhan D,et al.SSD: single shot multibox detector[C].Proceedings of the 2016 European Conference on Computer Vision.Cham: Springer,2016:21-37.
  [6]Lin T Y,Dollár P,Girshick R,et al.Feature pyramid networks for object detection[C].Proceedings of the IEEE conference on computer vision and pattern recognition,2017:2117-2125.
  [7]Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks.Ren S,He K,Girshick R,et al.IEEE Transactions on Pattern Analysis and Machine Intelligence.2015
  [8]李鹏飞,刘瑶,李珣,等.YOLO9000模型的車辆多目标视频检测系统研究[J].计算机测量与控制,2019,27(08):21-24+29.
  [9]You only look once:Unified,real-time object detection.Redmon J,Divvala S,Girshick R,et al.Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.2016.
  [10]YOLO9000:Better Faster,Stronger.Redmon J,Farhadi A.Conference on Computer Vision and Pattern Recognition.2017.
  [11]High-Speed tracking-by-detection without using image information.E.Bochinski,V.Eiselein,T.Sikora.2017 14th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS).2017.
  [12]Feature Pyramid Networks for Object Detection.Tsung-Yi Lin,Piotr Dollár,Ross Girshick,Kaiming He,Bharath Hariharan,Serge Belongie.Computer Vision and Pattern Recognition.2017.
  [13]Very deep convolutional networks for large-scale image recognition.Simonyan K,Zisserman A.ICLR.2015.
  [14]Faster r-cnn:Towards real-time object detection with region proposal networks.Ren S,He K,Girshick R,et al.NIPS.2015.
  [15]An improved tiny-yolov3 pedestrian detection algorithm.ZHANG Y,SHEN Y L,ZHANG J.Optik.2019.
其他文献
摘 要:随着新能源汽车的发展,电动汽车的电池寿命及使用效率成为共同关注的热点,而温度是影响电池性能的关键因素。基于目前实际问题,本项目拟设计一种基于被动散热-硅胶导热吸热和循环液体换热与主动散热-空气冷却相结合,以集提前预热和安全装置为一体的智能控温可连续工作的电池热管理系统。该系统能够及时有效地降低电池温度,增强电池稳定性,提高电池工作效率。  关键词:新能源汽车;电池热管理;热效率  中图分类
期刊
摘 要:介绍了ZD(J)9道岔的动作电路与表示电路的组成及常见道岔故障类型;分析了常见道岔故障的原因,并提出了道岔故障时的思路及各故障点的判断方法及处理流程;为防止道岔故障提出几点注意事项。  关键词:ZD(J)9道岔电路;道岔故障;原因分析;注意事项  中图分类号:U231.8 文献标识码:A  0 引言   ZD(J)9道岔是西安地铁正线信号的重要轨旁设备,对列车的折返、通过起着重要的作用
期刊
摘 要:铁路作为国家或企业的重要基础设施,在运营和安全方面都有着极高的要求,铁路调度系统基础数据尚未得到充分挖掘,安全管理仍有优化空间。随着大数据、物联网、云计算等现代化技术日益成熟,以规模化数据为基础提升管理效率与水平,能够有效驱动铁路现代化发展步伐;加快铁路调度大数据功能架构设计及研发运用,能够为充分挖掘铁路调度数据资源,提升铁路调度管理能力,提供有效的技术手段。  关键词:铁路;运输;调度;
期刊
摘 要:随着新线的开通、既有线运营年限的增长,服务标识管理工作中陆续出现各种问题,同时结合服务质量评价的相关要求,急需对车站公共区内及列车内的服务标识管理存在的问题进行分析,建立高效、规范、科学的管控标准与优化措施,为公司高质量发展添砖加瓦。  关键词:服务标识;服务质量评价;初探与实践  中图分类号:F572.6 文献标识码:A  0 引言  目前服务标识的来源主要有开通前期建设装修中的固定导
期刊
摘 要:分析了车辆的制动过程,确定了不同跟车类型和初始速度下高快速路需保持的基本安全间隔。从车辆减速和制动过程入手,结合高快速路上的车辆实际运行状况,确定了安全行驶过程中高快速路应保持的基本安全行车间隔。分析结果表明,同种车型安全运行时需要保持的车头间距随运行速度的增大而增大,车头时距基本保持不变;不同车型安全运行时需要保持的车头间距基本不变,车头时距则逐渐降低。  关键词:高快速路;车头间距;车
期刊
摘 要:自改革开放以来,由于社会的深入进步,我国在建设工程行业的制度逐渐完善,并在整个市场行业的竞争中占据着关键的地位,能够把这种方式当做一种激烈的竞争形式。而在建设过程中会涉及到有关合同的签订与管理,也是确保建筑工程质量,对施工过程中遇到的问题所产生的纠纷处理具有参考依据,进一步规范建筑施工的规范性。因此,本文简要的介绍了工程建设合同管理的概念,然后对其中的风险进行了分析,进而提出了合理的管理措
期刊
摘 要:我国社会经济发展对各行各业的发展都予以了促进,而在经济发展过程中最为关键的因素之一就是交通,交通对国家经济发展具有重要的作用,同时也关系着人们出行的舒适性、便捷性、安全性,随着我国不断推进城市建设工作,交通工程建设作为城市建设中的重要内容,为了加速推进城市建设并充分保障人们的出行安全,在实际交通工程施工中需要不断提升施工管理水平和施工质量。  关键词:交通工程;施工管理;质量控制  中图分
期刊
摘 要:随着城市化进程的不断加快,我国的建筑行业也呈现出一片飞速发展的态势,再加上各种先进技术的应用,建筑水平不断提升,工程造价是建筑过程的重要环节,在其全过程控制中引入BIM技术能够为整个工程项目的各个阶段提供可视化的信息模型,从而有效的优化工程造价的全过程控制,降低造价风险。基于此,本文基于BIM的工程造价全过程控制进行了分析。  关键词:BIM;工程造价;全过程控制  中图分类号:TU723
期刊
摘 要:在进行交通工程安全施工作业时,为了最大限度地减少经济损失,同时保障行车安全,需要科学合理的安置好公路标志牌。基于此,本文首先针对交通标志的作用及特点进行说明,并对交通标志施工中需要注意的问题及交通工程安全施工标志牌的应用进行探讨,以供读者参考。  关键词:安全设施;标志牌;施工现状;交通安全  中图分类号:U491.5 文献标识码:A  0 引言   据调查,交通事故已成为威胁人类生命
期刊
摘 要:针对机电工程施工管控,站在运维技术人员角度,展开了具体的论述,总结管控方法,共享给相关人员参考借鉴。实践中结合运维经验,围绕机电工程运行环节常见的问题,从施工环节提出防控措施,通过积极引入新理念和新方法,强化对机电工程施工作业质量的把关,切实保障工程效益目标的实现。  关键词:运维技术;机电工程;管理要点;控制要点  中图分类号:U417.9 文献标识码:A   近年来,受到基础建设与
期刊