基于深度学习的多道路场景多尺度车辆目标检测算法优化研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:aishangliuning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域的研究中,目标检测是一个十分重要的方向,其目的是使用神经网络对图像提取出特征信息,从而从整张图像内识别出需要辨别的目标,指出目标的类别以及位置。不同道路场景下的车辆目标检测问题是一个难点,由于不同道路场景下的道路方向、形状以及车辆的角度多变、尺度不一等。因此给不同场景下的车辆识别带来了困难。直接用目前主流的目标检测算法往往不能够得到一个令人满意的结果。针对多道路场景多尺度的车辆目标检测问题,提出了一个改进的YOLOv5算法模型以及一个优化后的注意力机制,从而优化多场景多尺度的车辆目标检测。本文的主要工作、相关的贡献,总结如下:(1)针对多道路场景多尺度车辆目标的特点,基于YOLOv5网络模型设计了一个改进的YOLOv5模型,即GFM-YOLOv5(Ghost Fuse Muti-Scale YOLOv5)。利用车辆目标尺度不一的特征,本改进结构增强了多尺度特征信息的提取。在多尺度特征信息融合时,通过结合AFF(Attentional Feature Fusion)多尺度特征融合模块,优化不同尺度的特征信息提取。同时将骨干网络部分替换成Ghost卷积模块,从而减少一定的参数量。最后构建了一个多场景多尺度的车辆目标检测数据集(Multi-scene Multi-scale Vehicle Datasets,MMVD)。并且优化的模型在本MMVD数据集中的车辆目标有提升效果。(2)基于YOLOv5模型设计在模型中添加注意力机制的方式,并通过实验比较常见注意力机制在MMVD数据集上的优劣性。根据车辆目标中所在道路场景复杂多变的特点,基于混洗注意力模块提出了一种针对多道路场景车辆目标检测改进的自校准混洗注意力(Self-calibration Shuffle Attention,Sc SA)。其改进了混洗注意力模块组内单元的注意力特征提取,并在其分组单元拼接时利用自校准卷积的方式强化通道与空间特征信息之间的联系与依赖关系,从而合并更丰富的特征信息来提高目标检测的效果。在MMVD数据集中的实验结果表明,增加该模块对车辆目标检测有提升效果。(3)结合本文提出的多场景多尺度车辆目标检测算法优化方法,设计了一个可以实时视频检测的多道路场景路况检测系统,可以实现对不同道路场景下的不同事件进行实时检测与报警。
其他文献
林麝(Moschus berezovskii)人工饲养繁育始于上世纪50年代末,历经60多年的不懈努力,近20年饲养种群呈现较快的增长,然而,饲养林麝种群的遗传多样性现状及遗传结构尚缺乏充分的研究,因而不利于种群遗传管理及其饲养种群种质保护与利用。本研究从陕西省宝鸡市凤县的逢春麝场、片仔癀麝场、达吉康麝场、留凤关海兴麝场以及汉中市留坝县的太子岭麝场采集365份新鲜的粪便样品,用分子生物学方法扩增林
城市公共交通系统在“以人为本”的指导理念下,对个体出行行为的深入研究,是城市公共交通系统发展的必要条件。智能交通卡数据为个体出行行为的研究提供了丰富的基础数据,但其中出行目的信息的缺失,使更深层次的理解个体出行行为和预测出行需求受阻。随着居民出行需求逐渐多样化,如何经济有效的补充智能交通卡数据中的出行目的成为了研究热点。本文使用智能交通卡数据,提取个体多日出行活动信息,划分个体活动区域,以活动区域
第三章生命回归在《若望福音》生命动态的解析中,我们看到启示父的光荣和大爱是耶稣在世独一无二的工作。父的工作和耶稣的工作之间,存在着一种相互关系。这工作是父所委托;耶稣向世界启示父的目的,就是要使人们"认识"父——献身给祂,而"认识"本身带来了永生。
期刊
随着我国乡村环境日益优化,乡村逐渐成为城市生活的补充,乡村农家乐也不断发展,主要功能不再仅仅是“吃农家饭,看乡村景”的休闲活动,还有民俗文化体验、农产品采摘等经营项目,甚至在乡村农家乐的基础上发展出了乡村酒店、乡村养老中心、共享体验农庄、特色小镇等多种新类型的乡村旅游产品。由此可见,随着时代不断发展,消费者需求的不断变化,未来农家乐的产业功能需要不断变化来适应新的产业形态,其空间形态与结构也必须随
高温超导磁悬浮列车是超导磁悬浮技术的主要应用方向之一,具有无需外部控制即可达到稳定悬浮的特性,相较轮轨列车有节能环保、速度应用区间广等优势,具有巨大的发展空间。低温系统作为超导磁悬浮的核心系统,冷却方法的选取及结构设计直接影响超导块材性能的发挥从而影响列车的运行性能。本文开展了传导冷却方法与液氮冷却方法对块材悬浮性能影响的研究,并提出了传导冷却方法的优化方案。最终针对磁悬浮列车的运行环境设计了液氮
在计算机视觉领域中,密集计数是十分重要的子领域,其目的是通过对输入神经网络的图像进行深度学习,提取深层特征,从而得到图像中计数目标的数量。根据实际研究与应用中所要计数的目标的不同,密集计数又可划分为人群计数,车辆计数等。高速公路拥堵场景下的车辆计数是一大难题,其有着道路情况复杂多变,车辆形态不一,车辆遮挡严重,车辆尺度变化较大等特点。因此,目前通用的密集计数算法并不能取得一个令人满意的结果。本文的
随着磁悬浮技术的快速发展,以Halbach阵列为代表的永磁结构的出现以及具稀土永磁材料的广泛运用,使得永磁电动悬浮系统越来越受到人们的关注。永磁电动式磁悬浮与其它类别的磁悬浮制式相比结构简单,价格低廉,不需要复杂的冷却系统和控制系统。本文将磁悬浮技术应用到传统汽车系统中,基于永磁电动悬浮原理搭建了一种新型磁悬浮汽车原理模型,并展开磁悬浮汽车原理模型工作模式以及动态特性方面的研究。首先基于环形Hal
随着我国铁路事业的快速发展,信号设计行业的工作量也在不断增加。车站信号平面布置图是铁路信号设计的基础,它能够反映车站室外信号设备的布置情况,是后续工程设计的数据来源。铁路信号行业中的车站平面布置图多采用AutoCAD软件进行绘制,该软件是目前应用最为广泛、使用人数最多的计算机辅助设计软件,它提供了基础的CAD功能,可以根据相关数据绘制出图形。传统车站信号平面布置图的设计任务繁重,要实现图形的局部调
学位
无条件文本生成的目的是生成与真实文本一样高质量、多形式的文本,而使用最大似然估计训练的自回归(Autoregressive,AR)神经语言模型常被用来作为无条件文本生成器。由于AR神经语言模型存在曝光偏差问题,即训练和推理阶段的输入不一致,所以生成文本的质量差并且多样性低。为了解决曝光偏差问题,生成对抗网络(Generative Adversarial Nets,GAN)被用来微调AR神经语言模型