【摘 要】
:
近年来人工智能技术的发展使得辅助驾驶和自动驾驶系统成为研究热点。在此应用中,准确且快速地实现道路场景下的多目标检测是辅助驾驶及自动驾驶技术的前提。基于深度学习的目标检测算法由此受到广泛关注且取得了一定成果,然而在复杂的道路环境中,待检测目标往往存在像素面积小、遮挡重叠情况严重等问题,会导致目标的误检、漏检,从而影响目标检测精度,为安全驾驶带来隐患。为解决此问题,本文对道路场景下的多目标检测方法进行
【基金项目】
:
河北省自然科学基金(F2020202045)
论文部分内容阅读
近年来人工智能技术的发展使得辅助驾驶和自动驾驶系统成为研究热点。在此应用中,准确且快速地实现道路场景下的多目标检测是辅助驾驶及自动驾驶技术的前提。基于深度学习的目标检测算法由此受到广泛关注且取得了一定成果,然而在复杂的道路环境中,待检测目标往往存在像素面积小、遮挡重叠情况严重等问题,会导致目标的误检、漏检,从而影响目标检测精度,为安全驾驶带来隐患。为解决此问题,本文对道路场景下的多目标检测方法进行了研究,主要研究内容如下:(1)为保证道路场景下目标检测的速度和精度,对当前算法中的单阶段目标检测算法做了分析与对比实验,通过对实验数据的分析,选择YOLOv5s算法作为本文后续研究的基准模型。YOLOv5s算法与其他对比算法相比,在检测速度上有明显优势。此外,YOLOv5s模型参数量小,对硬件部署设备要求低,还能保持较高的检测精度。(2)针对道路场景目标检测中小目标检测精度低的问题,在特征融合方法、数据增强、先验框设计三个方面对YOLOv5s算法进行改进。首先对YOLOv5s的主干网络做了扩展,并提出基于3D卷积的多尺度特征融合方法,以此代替YOLOv5s中的Neck结构可以融合全局范围的特征信息,从而加强小目标的位置和类别信息;然后提出针对小目标的数据增强方法,以复制-粘贴的方式增加小目标在图像中的实例目标占比;最后统计数据集中真实边框信息,使用聚类获得最合适的先验框尺寸。通过对比实验和直观的检测效果展示验证了多种改进方法的有效性,GIF-YOLOv5s算法在BDD100K数据集中m AP为53.53%。(3)针对目标检测中的遮挡问题,对YOLOv5s的后处理方法和损失函数做进一步改进。提出基于位置的先验框匹配方法,在选择真实框对应的先验框时考虑位置信息并根据距离赋予权重;使用Repulsion Loss代替原有损失函数;最后结合CIo U-NMS和Soft-NMS的优点提出了Soft-CIo U-NMS,替代原有非极大值抑制方法。前两种改进均减小了目标预测框与真实框的距离,增大与其他检测框的距离,第三项改进缓解了决策阶段的遮挡漏检。实验证明,本文所做改进均可有效提升遮挡目标的检测精度。(4)针对模型部署问题,研究了模型加速对模型的影响。本文使用NVIDIA公司的高性能深度学习推理优化器TensorRT对提出的道路场景目标检测方法进行加速推理,通过网络层融合与精度量化等手段对Py Torch模型进行加速,加速后的模型在保持网络输出基本不变的条件下有效降低了推理时间,提高了推理速度。
其他文献
大型室内场景通常在高程方向结构较为相似,导致激光雷达扫描点云在高程方向特征退化,传统激光雷达SLAM的无人机定位方法易发生高程特征误匹配。针对于此,提出了一种基于惯性/高度传感器信息辅助的机载三维激光雷达解耦SLAM算法:将高度传感器、惯性姿态引入点云初始化过程,提高初始位姿匹配精度;将基于多元正态分布的点云配准算法在水平、高度通道解耦,约束点云配准方向,提高高程退化环境下的定位精度;同时使得传统
目的 探讨信息-知识-信念-行为(IKAP)健康教育模式应用于血液净化患者对皮肤瘙痒程度及生活质量的影响。方法 选取2019年2月至2021年3月安徽省阜阳市第二人民医院血液净化中心收治88例维持性血液透析患者经随机数字表法分为两组。给予常规组(44例)患者常规健康教育,干预组行基于IKAP的健康教育。观察干预8周后患者自护能力、皮肤瘙痒程度、生活质量改变情况。结果 干预后,两组自护能力测定量表中
本论文是以中国的汉语国际教育与韩国对外韩语教育为中心,对两国本国语言普及政策及办法的研究。希望利用两国的本国语言普及政策和统计资料,比较汉语国际教育的“孔子学院”和对外韩语教育的代表性普及机构“世宗学堂”。从政策层面和教育层面进行比较分析,了解中国的汉语国际教育和韩国对外韩语教育的成果和问题点。目的是为了持续有效地发展,探索改善方案。进入21世纪时代后,世界各国为向全世界普及本国文化及语言做出了各
为克服无人机林间飞行环境复杂、作业多样化、点云数据质量难以评价等导致的飞行参数不合理、点云数据质量差的问题,提出一种基于同时定位与建图(Simultaneous Localization and Mapping, SLAM)的无人机林间环境飞行参数设定方法。首先使用三维激光雷达所采集的林间点云数据进行建图,然后通过建图轨迹与GNSS-RTK数据轨迹进行对比分析,评价点云数据的质量,最后根据其均方根
针对SWMM原始动态链接库缺乏相关应用接口函数和优化模块无法进行参数自动率定的问题,提出了一种基于PySWMM并耦合遗传算法的SWMM参数自动率定模型,并以重庆悦来新城为研究对象,选取36场独立降雨事件对SWMM进行校准和评估。结果表明,雨型特征对模型的模拟性能有较大影响;校准后的模型对不同雨型的降雨过程均有良好的适应能力,决定系数R~2达到了0.79以上,对发生频率较高的单峰靠前(Ⅰ型)降雨事件
针对现有深度学习算法对施工现场的工人安全帽佩戴检测速度和精度低,在检测到工人未佩戴安全帽时无法及时发出报警,本文设计并搭建了基于深度学习的安全帽佩戴检测应用系统。首先对深度学习中的Two Stage方法和One Stage方法展开研究,针对检测对象的特点对模型进行了改进,提高模型的检测精度和鲁棒性,对比两种方法后选择性能优异的模型应用于安全帽佩戴检测应用系统中,同时加入报警模块,检测模块在检测到工
成像椭偏仪是一种新兴的椭偏测量仪器,因其兼具椭偏测量的薄膜测量精度和显微测量的高空间分辨率而吸引了大量从事二维材料性质研究和微纳制造工艺研究学者的注意。现有的成像椭偏仪及类似设备的研究始于上世纪八十年代,在近40年的研究中取得了丰富的成果。综观现有的成像椭偏仪,普遍存在测量波段局限在可见光波段的问题,这桎梏了成像椭偏仪在材料学中的进一步应用。为此,本文研究了能在紫外到近红外的宽光谱范围内工作的成像
随着城市轨道交通车辆的快速发展,乘客对地铁车辆的舒适性提出了更高的要求,地铁车辆运营阶段的噪声问题成为目前广泛关注的热点问题,也是亟待解决的问题。文章从地铁车辆的噪声现状入手,分析轮轨相互作用引起的轮轨噪声问题,车体和薄弱环节的隔声与密封问题,以及隧道运行环境会产生混响声场环境差异问题等,为车辆噪声控制提供依据并指明方向。
随着现代社会的发展,传统的生活方式已经不复存在,当今社会中的非物质文化遗产成为了生活的点缀或文化产业中的符号,已然不复传统社会时期在经济生产和社会生活中的功能和意义,传承人也不得不面临着适应现代文明与保留传统技艺之间的割裂。非遗保护的核心是活态性保护,即“留形又留魂、见物又见人”,强调给予传承人有效的服务和支持。在推动非遗活态性保护工作中,社会工作能有效弥补政府部门在推动非遗保护中细节管理的不足,
<正>穿过岁月幽深的长廊,平谷见证了中华文明五千年璀璨与绚烂;透过历史深邃的眼眸,平谷读懂了这部东方巨著博大精深的睿语哲思。站在时代的宽厚肩膀上远眺,平谷有一段岁月,波澜壮阔,刻骨铭心;平谷有一种激情,经久不息,勇往直前;平谷有一种精神,穿越历史,照亮未来。平谷,地处燕山南麓与华北平原北端的交汇处,三面环山,中为平原谷地。平谷境内群山巍峨,水草丰美。万里长城在其东北部山间蜿蜒盘旋,映射着这一方古老