论文部分内容阅读
随着深度神经网络的兴起,目标检测作为计算机视觉中的一项基本任务,得到了快速发展,现已广泛应用于智慧城市、智能交通等众多领域。近年来,搭载目标检测功能的智能无人设备进一步推动了公共安全、防灾减灾、园区巡防、军事应用等领域的智能化,并已得到了一定程度的应用。然而,实际场景的复杂性和多样性使得目标检测面临着巨大的挑战。目前,复杂场景下的目标检测主要有两个问题。(1)形态固定的目标检测困难。以无人机场景下的小目标为例,因距离过远和角度多变,所获得的目标尺寸过小、目标特征不明显,导致现有检测算法存在大量漏检。(2)形态变化的目标检测困难。以火灾场景下的火焰和烟雾目标为例,此类目标形态、特征、边界变化均较大,导致现有检测算法准确率很低。本文从理论研究和算法应用角度出发,针对复杂的无人机场景及火灾场景,提出了三种不同的目标检测算法,并完成实际场景的应用。本文主要研究内容如下:(1)提出基于空间池化Darknet53的多尺度小目标检测算法。首先,以Darknet53为骨干网络,增加了新的空间金字塔池化(Spatial Pyramid Pooling,SPP)模块。SPP在空间上融合局部特征和全局特征,同时增大了感受野,从而能提取小目标检测所需的充足的上下文信息。其次,增加小尺度分支检测器。该分支融合了高层语义信息,提供了更精确的目标位置信息,并解决了标签重写问题。最后,采用距离交并比(Distance Intersection over Union,DIOU)损失作为算法的边框回归损失。DIOU使得预测边框更靠向目标的真实边框。将算法应用于UAVDT(Unmanned Aerial Vehicle Detection and Tracking,UAVDT)无人机场景数据集。实验表明,与同样以Darknet53为骨干网络的典型算法YOLOv3(You Only Look Once version3,YOLOv3)相比,本文提出的算法平均精度均值(mean average precision,mAP)比YOLOv3高7.6%。因此,本文提出的基于空间池化Darknet53的多尺度小目标检测算法既对地面端的目标有良好的检测效果,又增强了无人机高空场景下的小目标检测效果,具有较高的实际应用价值。(2)提出基于残差空洞跨局部Darknet53的多尺度小目标检测算法。首先,以跨阶段局部Darknet53(Cross Stage Partial Darknet53,CSPDarknet53)为骨干网络,提出了一种残差空洞空间金字塔池化(Residual Atrous Spatial Pyramid Pooling,RASPP)模块。RASPP不仅具有SPP模块的优点,而且保证融合阶段的小目标细节信息不丢失。其次,增加了一个更小尺度的检测器,进一步增强小目标的检测。最后,为了解决数据样本不平衡问题,引入了焦点损失函数(Focal loss)。将算法应用于UAVDT和Vis Drone2019(Vision Meets Drone 2019)无人机场景数据集。计算了UAVDT三类目标,Vis Drone2019十类目标,以及白天、黑夜、雾天等多种复杂环境下目标的检测准确率。实验表明,与同样以CSPDarknet53为骨干网络的高性能算法YOLOv4相比,本文提出的算法在绝大部分情况下均优于YOLOv4,mAP比YOLOv4分别高2.8%(UAVDT)和5.05%(Vis Drone2019)。由此可见,本文提出的基于残差空洞跨局部Darknet53的多尺度小目标检测算法可有效解决无人机场景的小目标检测问题,具有较好的应用价值。(3)提出基于跨局部ResNext50的多尺度目标检测算法。针对形态多变的目标,提出火焰与烟雾的目标检测算法。首先,解决火焰与烟雾数据集缺乏问题。通过大量的视频搜索、视频分帧、数据筛选、目标标注等工作,构建了包含9729张图片、70类场景的火焰与烟雾目标数据集。然后,以跨局部ResNext50(Cross Stage Partial ResNext50,CSPResNext50)为骨干网络,结合SPP及多尺度检测,使用平滑曲线Mish函数、交叉熵函数和完全交并比(Complete Intersection over Union,CIOU)损失函数。整个训练过程采用了Mosaic数据增强方式的策略。将算法应用于自建的火焰与烟雾数据集。实验表明,本文提出的算法对火焰和烟雾检测的mAP高达90.36%,相比YOLOv3和YOLOv4分别高出7.89%和4.58%。因此,本文构建的火焰与烟雾目标数据集解决了相关数据集缺乏问题,本文提出的基于跨局部ResNext50的多尺度目标检测算法可应用于自动火灾检测系统中。综上所述,本文针对复杂场景下的目标,提出了三种基于深度学习的目标检测算法,并应用于实际场景及数据,获得较高的客观指标。基于空间池化Darknet53的多尺度小目标检测算法可应用于高空场景下的小目标检测,基于残差空洞跨局部Darknet53的多尺度小目标检测算法可用于多种复杂无人机场景下的小目标检测,基于跨局部ResNext50的多尺度目标检测算法可实现火灾场景下多形态的火焰与烟雾检测。因此,本文提出的目标检测算法具有一定的理论创新和应用价值。