基于YOLOv3模型的交通标志检测算法优化和压缩研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:enginery_puppet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汽车的普及在给人们的生产生活带来极大方便的同时,也造成了如交通拥挤、交通安全等一系列的社会问题,近年来兴起的智能交通则有望解决这些问题。道路交通标志是智能交通的重要环节之一,道路交通标志的检测对无人驾驶、辅助驾驶等技术具有重要的促进作用,也引起了越来越多研究人员的关注。传统的交通标志检测算法主要基于交通标志的形状、颜色等外观信息进行,且依赖于通过人工方法进行特征提取。人工提取目标特征不仅有很大难度,而且易受天气、光照、拍摄角度等各种因素的影响,而基于深度学习的目标检测算法则能够克服传统目标检测算法的缺点,达到较好的目标检测效果。本文选取道路交通标志数据集GTSDB和CCTSDB,并使用深度学习技术进行了以下几个方面的研究:
  第一,选取较为常用的三个单阶段目标检测算法SSD、RetinaNet和YOLOv3分别对两数据集进行检测。实验结果表明,YOLOv3目标检测算法在两数据集上能够取得较好的检测效果,且其检测速度能够达到实时检测的要求。
  第二,针对YOLOv3模型定位不准确且对小目标检测能力差,而实验数据集中的交通标志大多为小目标的问题,对YOLOv3模型进行改进以提高其在道路交通标志数据集上的检测精度。首先,使用GIoUloss作为边界框损失函数,可有效解决YOLOv3模型中边界框损失函数采用L2范数进行计算,而却采用IoU进行测评的缺点,能够使得网络朝着预测框与真实框重合度较高的方向去优化。其次,在模型中引入focalloss,能够有效解决模型正负样本不平衡和易检难检样本不平衡的问题,提高模型的检测精度。另外,在模型中加入长连接,使图像浅层特征能够直接传入网络的更深层与深层特征合并,使网络中深层特征图中的特征信息更完整,进而使网络对目标的定位及分类能力有所高。实验结果表明,三种改进方法均能提高模型的检测精度,同时融合这三种改进方法后,模型的mAP提高最多,且仍能达到实时检测的要求。
  第三,YOLOv3模型对设备的计算能力、内存等要求较高,难以在车辆等资源受限平台上部署。若交通标志检测通过网络进行传输,则受网络状况影响较大,会产生较多问题。本文提出了一种压缩优化的StrongTiny-YOLOv3模型,可减小模型对设备性能的依赖。StrongTiny-YOLOv3模型通过改进的FireModule对YOLOv3模型进行压缩,减小模型参数量。同时,通过在模型FireModule层间加入short-cut、对非极大值抑制算法进行改进等方法来提高模型检测精度。实验结果表明,StrongTiny-YOLOv3模型的参数量减少为1.1M,模型存储大小减小为7.5M,与Tiny-YOLOv3模型相比参数量减少了87.3%,模型存储大小减小了77.9%。在GTSDB和CCTSDB数据集上,StrongTiny-YOLOv3模型的检测mAP比Tiny-YOLOv3分别提高了13.1%和4.2%。在GeForce940MX上的实验结果显示,StrongTiny-YOLOv3模型的检测速度比Tiny-YOLOv3模型提高了22.8%,比YOLOv3模型提高了764%。
其他文献
目前制约道路交通系统发展的问题主要集中在交通事故、交通污染和交通拥堵方面。在汽车中开始大范围使用电子辅助设备,主要实现的辅助功能有电子稳定控制,车道偏离后的预警,以及紧急制动等。但针对降低人为因素导致的交通事故发生率的问题,目前车辆所使用的电子辅助系统并不能完全达到智能辅助驾驶的目的,也无法利用事故预警,以及风险评估等形式,来降低人为交通事故。因此,为了实现应用辅助驾驶系统或无人驾驶技术降低交通事
学位
在过程控制、流体控制、以及网络化控制等系统中,普遍存在着时滞现象和未知动态干扰,其控制问题一直是控制领域研究的热点话题。时滞和未知干扰往往是制约系统性能的主要因素,这些不确定因素通常会严重影响系统的响应速度和控制精度。因此,对于在系统中含有未知扰动、时滞等现象的研究在现阶段有十分重要的意义和价值。  自抗扰控制器(ADRC)作为一种新型控制器,具有较强的稳定性和鲁棒性,通过引入扩张状态观测器,实现
六足机器人作为一种并联机器人,因其运动方式灵活多变,稳定性强,所以其环境适应性较好,已经成为机器人中的主流产品。然而由于六足机器人腿部数量较多,使得六足机器人的控制难度增加。中枢模式发生器(CPG)的出现,为六足机器人的控制方法提供了新的思路。本文对六足机器人识别地形然后采取相应的步态规划进行研究,利用CPG控制六足机器人在地形环境中平稳行走。具体研究如下:  首先,通过研究国内外论文介绍目前六足
多智能体系统广泛存在于实际生产生活中,是控制领域的研究热点,而一致性问题作为智能体协调合作的基础,更是深受关注。受限于能源供应限制,以嵌入式微处理器为核心的多智能体系统在实际应用时约束较多,因此一致性控制协议不仅要满足性能要求,更要提高资源利用率。事件触发控制对于降低资源消耗效果显著,故而被认为是资源受限环境下的优良控制策略。再则,现有的关于事件触发控制下多智能体系统一致性问题研究的文献多是针对智
分数阶微积分是整数阶微积分的统一与延伸,是求函数的任意阶导数或积分。由于分数阶微积分算子的长记忆性和无限维等特点,使得分数阶模型可以简洁准确地描述复杂系统的动态行为。系统辨识作为分数阶系统建模的有效手段引起了很多学者的关注。目前,在分数阶系统辨识中,直接利用分数阶微分定义计算输入输出信号的分数阶微分存在计算量大,容易扩大噪声等缺点。为此,本文利用块脉冲函数的分数阶运算矩阵将函数的分数阶运算转换为代
受雾霾微粒影响,含雾图像清晰度及色彩饱和度降低,图像质量产生退化。图像去雾算法能够有效提高含雾图像能见度、改善图像视觉效果,因此具有十分重要的研究价值。结合含雾图像特征,本文着重研究了基于物理模型的图像去雾算法,主要工作如下:  (1)针对当前全局大气光估计方法存在易受极值区域影响,导致大气光估计产生偏差的问题,提出了一种基于最小方差投影的全局大气光估计方法。通过将图像沿行列方向投影,分析不同行列
学位
从地理领域文本等非结构化数据中抽取实体和关系,为构建地理知识图谱、智能问答等应用提供了重要基础。由于地理领域标注语料资源较少,难以使用深度学习等依赖大规模标注语料的方法,利用知识库中的领域知识对地理语料库进行表示增强,可以有效缓解语料不足的问题。传统神经网络模型在处理一维序列、二维网格数据时表现优异,但不能很好地处理知识库等图结构数据。现有的实体关系抽取模型不能很好地处理语料库中多元实体关系的情况
学位
目前语音合成技术使用大量的来自单个说话人的语料库训练网络模型,以合成特定人的音频信号。面对个性化的实际应用场景,现有的语音合成技术在数据资源和定制周期上存在局限性。多说话人语音合成技术作为语音合成领域的分支,能够以高效利用数据的方式为各种说话人生成符合人类听觉的语音。一般从语音自然度和音色相似度两方面,主观地评判语音合成质量。近年,谷歌提出的从说话人验证到多说话人语音合成的迁移学习方法在语音自然度
物联网设备的普及给人们的日常生活和工作提供了方便,但同时也带来了许多安全风险。近年来,利用固件中的漏洞对物联网设备进行攻击的事件时有发生,使得固件的安全问题受到了越来越多的关注。其中,跨平台的固件漏洞检测是固件安全的一个重要研究方向。由于代码复用现象的普遍存在,导致不同平台上的固件经常受到相同已知漏洞的影响。通过对跨平台的固件漏洞进行检测,可以降低同源已知漏洞对设备所造成的威胁,有助于提升系统的安
学位
现货实例定价方式是一种基于拍卖的虚拟机实例定价方式,它可以帮助云服务提供商有效处理闲置云计算资源,减轻库存压力,因此已在亚马逊弹性计算云、谷歌云和阿里云等国内外主流云服务提供商中得到较为广泛的应用。随着现货实例的逐渐普及,如何制定合理的投标策略成为越来越多云用户面临的关键问题。现有关于现货实例投标策略的研究大多围绕如何在时间约束下最大化用户利益展开讨论,较少关注用户同时面临时间与预算约束的情形,也
学位