论文部分内容阅读
随着经济和科技的发展城市车辆数量不断上涨,智能交通系统开始逐渐应用到人们的日常生活中。现代化城市交通中,视频监控覆盖了大部分的行车区域,基于计算机视觉深度学习的车辆检测方法可广泛应用于交通视频图像这一场景。但在现实场景的应用中现有的目标检测方法的精准度仍然无法满足实际的需求,因此如何实现复杂环境下精准的车辆检测对智能交通有着重大的研究意义。本文对城市交通场景下的车辆检测问题进行研究,提出了改进YOLOv3的交通车辆检测方法,并在本文提出的数据增广后的KITTI交通车辆数据集上进行训练。本文在数据增广方法的研究上,提出了将混合数据增广和CutMix数据增广用于目标检测数据集的方法,并应用于车辆类别筛选后的KITTI车辆数据集。通过实验得出结论CutMix数据增广为KITTI数据集的最佳数据增广方法,作为本文构建的训练数据集。本文在目标检测算法研究方面,对YOLOv3目标检测模型进行了改进用于车辆检测。改进分为两点,首先,借鉴了可变形卷积网络(Deformable Convolutional Networks,DCN)的思想,对YOLOv3原始的Darknet-53主干网络结构进行优化,在残差模块中加入了可变形卷积并优化整体结构,称之为DCNdarknet,作为改进YOLOv3模型的主干网络。其次,改进了多尺度融合部分,将特征融合部分提升到4个尺度,采用转置卷积进行上采样,增加模型了对小目标的检测能力。通过后续实验的对比发现,在使用了CutMix数据增广的KITTI数据集上本文改进的YOLOv3车辆检测模型上进行训练,获得了92.37%的mAP,说明在车辆检测方面,模型的改进以及训练数据集的增广方法对车辆检测的性能带来了一定的提升,完成了精准的车辆目标检测。