面向复杂场景下的目标检测深度学习算法研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:hzjojo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度神经网络的兴起,目标检测作为计算机视觉中的一项基本任务,得到了快速发展,现已广泛应用于智慧城市、智能交通等众多领域。近年来,搭载目标检测功能的智能无人设备进一步推动了公共安全、防灾减灾、园区巡防、军事应用等领域的智能化,并已得到了一定程度的应用。然而,实际场景的复杂性和多样性使得目标检测面临着巨大的挑战。目前,复杂场景下的目标检测主要有两个问题。(1)形态固定的目标检测困难。以无人机场景下的小目标为例,因距离过远和角度多变,所获得的目标尺寸过小、目标特征不明显,导致现有检测算法存在大量漏检。(2)形态变化的目标检测困难。以火灾场景下的火焰和烟雾目标为例,此类目标形态、特征、边界变化均较大,导致现有检测算法准确率很低。本文从理论研究和算法应用角度出发,针对复杂的无人机场景及火灾场景,提出了三种不同的目标检测算法,并完成实际场景的应用。本文主要研究内容如下:(1)提出基于空间池化Darknet53的多尺度小目标检测算法。首先,以Darknet53为骨干网络,增加了新的空间金字塔池化(Spatial Pyramid Pooling,SPP)模块。SPP在空间上融合局部特征和全局特征,同时增大了感受野,从而能提取小目标检测所需的充足的上下文信息。其次,增加小尺度分支检测器。该分支融合了高层语义信息,提供了更精确的目标位置信息,并解决了标签重写问题。最后,采用距离交并比(Distance Intersection over Union,DIOU)损失作为算法的边框回归损失。DIOU使得预测边框更靠向目标的真实边框。将算法应用于UAVDT(Unmanned Aerial Vehicle Detection and Tracking,UAVDT)无人机场景数据集。实验表明,与同样以Darknet53为骨干网络的典型算法YOLOv3(You Only Look Once version3,YOLOv3)相比,本文提出的算法平均精度均值(mean average precision,mAP)比YOLOv3高7.6%。因此,本文提出的基于空间池化Darknet53的多尺度小目标检测算法既对地面端的目标有良好的检测效果,又增强了无人机高空场景下的小目标检测效果,具有较高的实际应用价值。(2)提出基于残差空洞跨局部Darknet53的多尺度小目标检测算法。首先,以跨阶段局部Darknet53(Cross Stage Partial Darknet53,CSPDarknet53)为骨干网络,提出了一种残差空洞空间金字塔池化(Residual Atrous Spatial Pyramid Pooling,RASPP)模块。RASPP不仅具有SPP模块的优点,而且保证融合阶段的小目标细节信息不丢失。其次,增加了一个更小尺度的检测器,进一步增强小目标的检测。最后,为了解决数据样本不平衡问题,引入了焦点损失函数(Focal loss)。将算法应用于UAVDT和Vis Drone2019(Vision Meets Drone 2019)无人机场景数据集。计算了UAVDT三类目标,Vis Drone2019十类目标,以及白天、黑夜、雾天等多种复杂环境下目标的检测准确率。实验表明,与同样以CSPDarknet53为骨干网络的高性能算法YOLOv4相比,本文提出的算法在绝大部分情况下均优于YOLOv4,mAP比YOLOv4分别高2.8%(UAVDT)和5.05%(Vis Drone2019)。由此可见,本文提出的基于残差空洞跨局部Darknet53的多尺度小目标检测算法可有效解决无人机场景的小目标检测问题,具有较好的应用价值。(3)提出基于跨局部ResNext50的多尺度目标检测算法。针对形态多变的目标,提出火焰与烟雾的目标检测算法。首先,解决火焰与烟雾数据集缺乏问题。通过大量的视频搜索、视频分帧、数据筛选、目标标注等工作,构建了包含9729张图片、70类场景的火焰与烟雾目标数据集。然后,以跨局部ResNext50(Cross Stage Partial ResNext50,CSPResNext50)为骨干网络,结合SPP及多尺度检测,使用平滑曲线Mish函数、交叉熵函数和完全交并比(Complete Intersection over Union,CIOU)损失函数。整个训练过程采用了Mosaic数据增强方式的策略。将算法应用于自建的火焰与烟雾数据集。实验表明,本文提出的算法对火焰和烟雾检测的mAP高达90.36%,相比YOLOv3和YOLOv4分别高出7.89%和4.58%。因此,本文构建的火焰与烟雾目标数据集解决了相关数据集缺乏问题,本文提出的基于跨局部ResNext50的多尺度目标检测算法可应用于自动火灾检测系统中。综上所述,本文针对复杂场景下的目标,提出了三种基于深度学习的目标检测算法,并应用于实际场景及数据,获得较高的客观指标。基于空间池化Darknet53的多尺度小目标检测算法可应用于高空场景下的小目标检测,基于残差空洞跨局部Darknet53的多尺度小目标检测算法可用于多种复杂无人机场景下的小目标检测,基于跨局部ResNext50的多尺度目标检测算法可实现火灾场景下多形态的火焰与烟雾检测。因此,本文提出的目标检测算法具有一定的理论创新和应用价值。
其他文献
控制图作为现代工业生产中重要的质量诊断工具,能够发现制造过程中的异常波动。控制图模式识别对利用控制图对加工过程进行有效监测和异常源诊断具有较为重要的作用。当企业需要保证制造系统的柔性从而使其正常运行时,就需要对质量过程加以实时监控,进而可以及时发现生产加工过程出现的异常,最终实现降低损失、减少成本的目的。首先,根据对相关文献的研究与总结,发现近年来控制图模式识别的研究主要以人工神经网络和支持向量机
给出了三元思维的概念,从三元思维角度介绍了三支决策的基本思想,即通过3个独立且相关的部分来解释和处理一个整体,将一个整体合理地分为3个部分,并采取有效的策略处理每个部分,从而获得所需要的效果。然后,综述了三支决策的几种相关模型及具体应用。最后,从模型与应用两方面回顾了三支决策的研究现状并展望了未来的研究方向。
诺氟沙星(NOR)是一种喹诺酮类抗菌药,被广泛应用于治疗人类和动物疾病,但是如果长期食用含有低剂量NOR的动物源性食品,会导致骨骼发育迟缓、头晕、厌食、抑郁等,因此我国农业部指出停止经营使用用于食品动物的NOR。所以开发一种高效、灵敏的方法快速检测动物性食品中的NOR极为重要。本文用金纳米粒子(Au NPs)和钴铁基-金属有机框架(Co Fe-MOFs)支撑聚吡咯(Ppy)基分子印迹聚合物(MIP
路径规划是智能驾驶技术研究领域的核心,是实现汽车智能化的关键环节。目前大多数路径规划研究中都将障碍物视为静止状态。本文考虑实际行车环境中前方障碍车辆的动态移动性,提出一种基于考虑环境车辆动态移动性的高速智能车轨迹规划方法。主要研究工作包括:(1)基于支持向量机(Suppport Vector Machine,SVM)算法识别前车驾驶意图。分析智能车面临的典型驾驶场景,利用Prescan软件搭建与之
特种印刷设备对于连续运行的要求较高,并且检修困难,一旦出现非正常性停机,会带来重大的经济损失。因此,一般采用固定周期来进行设备的计划运维。这种运维方式对企业而言,不但成本高,设备利用率低,而且在降低设备故障率方面收效甚微。为解决这一问题,采用设备故障在线监测和预警的方法,实现预防性运维,具有十分重要的理论与实用价值。基于特种印刷设备的结构及故障特点,本文以某印刷企业的凹印设备为研究对象,对其故障的
本文以逆变器控制参数整定为研究对象,将人工蜂群(ABC)算法应用于逆变器控制参数整定中,提出一种基于混沌改进人工蜂群(CIABC)算法的逆变器控制参数整定方法。主要工作有以下几个方面:1.针对ABC算法中存在的“早熟”现象,引入Tent混沌映射改进策略,提升了ABC算法的全局搜索能力,寻优精度和收敛速度,得到CIABC算法。多组测试函数验证了所提改进方法的有效性。再将CIABC算法应用到PID控制
2021年《民事诉讼法》修订主要涉及独任制、司法确认、小额诉讼的适用范围、以及在线诉讼及送达规则等,对作为基本制度和基本程序的合议制、普通程序、传统线下诉讼、送达等都构成冲击。需要明确民事诉讼法以公正为基本价值,以司法审判为基本功能,以合议制为基本制度,以普通程序为基本程序。其他制度和程序都服务于民事诉讼法的基本价值和基本功能。应当以"基本"与"其他"之间的关系衡平为核心线索,实现民事诉讼法律规范
随着能源问题的日益突出,新能源的开发和利用越来越重要,已成为当今社会要着力解决的一个重大问题。近年来,我国大力发展光伏发电和风力发电,因此,并网逆变器的研究也引起了学界业界的高度重视。然而,在实际运行中,由于受到接入负荷、故障、谐振等因素的影响,会出现不平衡电网电压的情况而影响逆变器运行,进而影响并网发电安全运行。因此,需要考虑不平衡电网电压下并网逆变器的控制策略问题。本文以不平衡电网电压情况下的
一般性人机交互的方式主要包括离线示教和专用工具在线示教,这些方式示教后的机械臂只能按照固定的轨迹进行重复运动。随着人机协作技术的发展,常常按照工况的需要,在线示教机械臂的运动轨迹,以便发挥人的智慧和机械臂的负重能力及运动的精确性。为此,本文设计了自主跟随人体手臂运动的六自由度机械臂系统,实现机械臂模仿人体手臂相似运动和机械臂末端精确跟随人体手臂末端运动两种控制算法,具体工作内容如下:(1)本文合理
随着智能化的时代来临,在机器学习及数据挖掘领域所涉及的数据集中,数据量和数据维度呈爆炸式的增长,高维、分布稀疏的数据对现有的聚类方法提出了严峻的挑战。在面对高维、分布稀疏的数据时,训练模型常常会出现过拟合、训练时间长、训练效果极差等问题,这种现象在计算机领域被称为维度灾难。聚类分析以相似性为基础,根据某个方法或准则,将数据划分为具有相似特征的类或簇。其目标是使得同一个类或簇内的数据相似性尽可能大,