论文部分内容阅读
目标检测是计算机视觉领域的一项基础且重要的任务,它是从指定图像中判断所检测目标的类别并定位其所在的位置,具有非常广阔的应用前景。随着深度学习技术的快速发展,基于回归方式的单阶段目标检测算法因其检测速度较快、检测精度较高得到快速的发展。因为复杂交通道路场景中存在相当多尺度较小、局部被遮挡的目标,直接采用现有的单阶段目标检测算法进行检测往往会出现检测精度较低、边界框定位不够准确等情况,且模型的使用会受到系统资源的限制。为了提升复杂交通道路场景中视觉目标检测的性能,本文分别以Refine Det与YOLOv5s两种单阶段目标检测算法为基本框架,并通过在自建数据集上对算法进行改进与评价,使之满足实际工程应用的需求,具有理论意义与应用价值。本文主要的研究内容及创新点有如下几个方面:(1)针对复杂交通道路场景中存在多种尺度的目标,提出一种基于改进Refine Det的多尺度目标检测优化算法。首先,将Refine Det网络结构中的ARM模块输出的主特征映射图与改进的LFIP轻量级特征化图像金字塔网络所生成的多尺度特征映射图相融合;其次,在Refine Det网络结构中的ODM模块嵌入改进的RFB感受野模块;然后,采用CIoU Loss作为RefineDet算法模型中的ODM模块的边界框损失函数;最后,在T-Monitor数据集上验证本算法。本算法的m AP为87.2%,相比原Refine Det算法的m AP提升1.1%,相比SSD算法的m AP提升3.7%。由实验结果可知,本算法能够在一定程度上解决复杂交通道路场景中小尺度目标检测精度较低的问题。(2)针对目标密集的交通道路场景中存在局部被遮挡的目标,提出一种基于改进Refine Det的密集目标检测优化算法。首先,在Refine Det网络结构的TCB模块中加入改进的CBAM注意力模型;其次,在Refine Det算法模型中的ODM模块嵌入改进的Res Block残差预测模块;然后,采用Repulsion Loss排斥力损失函数作为ODM模块的边界框回归损失函数;最后,在C-Monitor数据集上验证本算法。本算法的m AP为85.9%,相比原Refine Det算法的m AP提升0.8%,相比SSD算法的m AP提升3.6%。由实验结果可知,本算法能够一定程度上解决目标密集的交通道路场景中局部被遮挡目标检测精度较低的问题。(3)针对车辆驾驶场景中轻量级目标检测算法的检测精度较低的情况,提出一种基于改进YOLOv5s的道路目标检测优化算法。首先,将ECA通道注意力模块嵌入到YOLOv5s算法模型主干网络中的Bottleneck CSP1模块,并对每相邻的三个Bottleneck CSP1模块的首尾添加一个跃层连接以加强网络中特征信息的重用;其次,将YOLOv5s算法模型的颈部网络结构改进为BiFPN加权双向特征金字塔网络结构;再次,采用改进的Aggregation Loss聚集损失函数作为边界框回归损失函数;最后,在V-Monitor数据集上验证本算法。本算法在V-Monitor数据集上的m AP为81.5%,相比原YOLOv5s算法模型的m AP提升1.3%;在检测速度方面,本算法在GTX1080上的FPS为59.5fps,相比原YOLOv5s算法模型减少12.4fps。由实验结果可知,本算法能够一定程度地提升轻量级目标检测算法在车辆驾驶场景中的检测精度。(4)针对车辆驾驶场景中目标检测算法占用系统资源较多的问题,提出一种基于改进YOLOv5s的轻量级目标检测优化算法。首先,先将YOLOv5s算法模型主干网络中后三个Bottleneck CSP1模块替换为相应的Ghost Bottleneck模块,并将SPP模块之前的CBH模块替换为深度可分离卷积,在SPP模块之后添加一个ECA注意力模块;其次,在颈部网络的PANet网络结构的基础上,融合ASFF自适应空间特征模块;再次,采用CIo U Loss作为YOLOv5s算法模型的边界框回归损失函数;最后,在V-Monitor数据集上验证本算法。本算法在V-Monitor数据集上的m AP为80.5%,相比原YOLOv5s算法模型的m AP略微提升0.3%;在参数量方面,本章算法的参数量为6.19MB,相比原YOLOv5s算法模型的参数量减少1.06MB;在GTX1080上,本算法的FPS为74.6fps,相比原YOLOv5s算法模型增加2.7fps。由实验结果可知,本算法在保持一定检测精度的前提下,能够一定程度上减少模型的参数量,并提升了检测速度。总的来说,针对复杂交通道路场景中存在相当多的小尺度目标、局部被遮挡目标以及算法占用系统资源较多等的情况,本文分别以Refine Det与YOLOv5s两种高效的单阶段目标检测算法为基础,提出了四种改进的视觉目标检测算法,并在自建数据集上验证了改进目标检测算法的有效性和可行性,为下一步在交通视频智能监控、车路协同与自动驾驶等领域的研究与应用提供研究基础及思路。