基于YOLOv3的目标检测方法研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:xushieng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在国家推出的“科技强国”战略背景下,人工智能和计算机视觉作为现代科技最前沿的计算机技术得以迅速发展。目标检测是计算机视觉领域中重要的研究方向之一,被广泛应用于社会的各个领域,例如:军事、医疗、交通及安全等。伴随着人工智能方法的不断改进与创新,基于深度学习的目标检测研究受到了学者们的青睐。基于深度学习的目标检测方法有泛化性能好、适应性强、鲁棒性好等优点,但是目前对目标检测方法的研究都只在检测速度或精确度上有所提升,很难在两者间做到平衡,如何使目标检测器达到高精度和高速检测是亟待解决的问题。针对这一问题本文基于YOLOv3模型从候选框筛选模块、主干网络和颈部连接等方面进行了相关研究工作:1.对深度学习模型中One-stage和Two-stage框架模型共有的候选框筛选模块进行改进。分析了在候选框筛选中常用的非极大值抑制算法的特点,针对非极大值抑制算法只能选择相对最优候选框,无法进一步调整候选框位置的问题,提出了候选框融合算法。旨在选择局部极大值候选框的同时,将冗余框的位置信息有选择性地融合进极大值候选框中,使极大值候选框内的目标信息量最大化。通过该方法可实现在神经网络之后对目标进行二次定位,在最终性能评价时获得更高的指标。2.利用ResNeXt改进YOLOv3主干网络的模型研究。针对Darknet-53主干网络特征提取能力差的缺点,提出一种性能更加强大的主干网络:Res_Darknet。首先基于Res Ne Xt提出改进方法,构造一种新的残差块,然后利用改进残差块重新设计一种符合YOLOv3结构特点的主干网络。最后与其他深度学习模型相比较,改进模型的综合性能更好。3.引用注意力机制和多分支卷积优化YOLOv3颈部连接的模型研究。针对YOLOv3颈部连接中易产生特征信息丢失和特征表达能力差的缺点,提出了改进YOLOv3模型。首先设计一种特征图拼接模块,用于增强重要特征信息的表达。其次,提出了一种特征图映射模块,用有多种感受野的多分支卷积模块替换原模型中简单的多层堆叠卷积结构,从而捕获更丰富的特征信息。通过实验验证,改进方法可实现实时目标检测,且精确率更高。
其他文献
学位
交通拥堵作为全世界亟待解决的重要问题之一,越来越受到国家与政府的关心与关注。智能交通系统是当今社会解决交通出行问题的又一创新方式,其将先进的科学技术应用于道路交通系统,旨在从监测、预警、诱导等多方面解决交通拥堵问题。智能交通系统中最重要的一环是交通流预测,高效、实时、准确的交通流预测能够有效缓解城市道路出行状况,一方面可以为人们日常出行提供可靠的交通诱导信息,降低高峰出行的可能;另一方面也可为政府
随着我国国民经济和社会的飞速发展,一些新型建筑的现代化程度不断提高。由于这些建筑功能复杂、人员密集、可燃物多等特点,一旦发生火灾很容易造成巨大的人员伤亡和经济损失。因此,如何在复杂的现代化建筑中保证人员安全有效疏散成为迫切需要解决的问题。本文以某高校拟建综合教学楼为例,将BIM技术与计算机疏散模拟技术相结合,建立基于BIM的建筑疏散仿真模型,进行可视化疏散模拟实验,来检验该综合教学楼消防设计的合理
随着人工智能在多学科多领域的研究和发展,数字图像处理技术也变成了热门话题,并逐渐渗透进人们的生产生活中,运用到了各个领域,成为当前计算机领域一个重要的研究方向。为了实现高效的人脸识别,提高相关算法的抗干扰性,保证人脸的完整性和真实性,本文研究了基于D-S证据理论和局部领域模式的人脸识别算法。主要研究内容如下:局部二值模式(LBP)能够更好的度量局部图像的纹理特征,即使在光照敏感和姿态各异等情况的影
当今,互联网技术飞速发展,制造业向“智能制造”和“网络协同制造”方向转变。在网络协同制造平台中,关于产品生产数据集成技术的研究是当下的研究热点之一,对指导生产以及为定制生产等提供决策依据有重要意义。其中结合商品与用户数据并对用户进行商品推荐是产品数据集成技术的一个重要研究方向,如何搭建合理的数据集成模型进行商品推荐并提升用户的满意程度,具有理论意义与实际工程应用价值。本文以支持大规模定制的网络制协
机器视觉是研究如何使机器像人类一样利用视觉来获取场景中信息的学科。双目测量是机器视觉的一个重要分支,其模仿人类视觉系统的原理,在采集图像的基础上还可获得场景的深度信息,如今已广泛应用于工业现场、交通辅助、安防服务、医疗和军事等领域中。相较于依赖其它传感器的测量方法,双目测量具有测量视场更广、系统结构简单、设备之间工作互不干扰等优点,是一种理想的非接触式可见物体测量方法。而立体匹配任务是双目视觉系统
精确放疗是治疗肿瘤的重要方法之一。医用机械臂在放疗系统中起到支撑患者的作用,如何高效精准的将患者肿瘤区域对准束流,是行业难题之一。利用CT图像通过分割配准给出空间坐标系下的靶区位置,引导医用机械臂运动实现肿瘤自动精准定位,对提高摆位效率、减少术前人工干预、节约医疗资源、提高放疗效果都有着举足轻重的意义。目前国内在CT图像引导自动定位技术领域的研究尚处于初期阶段。本文研究基于改进的影像预处理算法和自
钢丝绳芯输送带是带式输送机的牵引和运载构件。X射线检测法是检测煤矿输送带内部钢丝绳芯故障的主要方法。通过目标检测算法对X射线图像中的故障区域进行定位以及辨别,既可以实现钢丝绳芯输送带故障实时检测,又能降低人力成本。本文以煤矿钢丝绳芯输送带为检测对象,提出基于深度学习的钢丝绳芯输送带故障检测算法。本文研究的主要内容有:(1)钢丝绳芯输送带的X射线图像采集及故障特征分析。分析X射线检测原理及检测系统组
重离子放疗流程中,患者在分次诊疗过程中需要通过CT图像引导多次摆位,耗费时间长,辐照剂量大。为了减少患者在摆位时受到的辐射剂量,提高分次诊疗时的摆位效率,本文研究通过在术前对人体进行三维扫描重建,将模型用做定位基准,分次摆位时通过模型比对、位姿调整实现虚拟定位,确保分次诊疗、摆位前后时人体与床板间的位置变化最小,为提高图像引导精准定位效率提供技术保障。如何通过数据采集、点云计算、点云配准实现三维人
随着机器视觉技术的发展,基于视觉的实时环境建模技术在远程医疗、人工智能、自动驾驶等领域发挥着重要的作用,受到学术界与工业界研究者的广泛关注,并取得丰硕的成果。近年来随着新型深度相机的不断发展,基于主动式深度获取实时三维环境建模技术已经成为热点,而针对轻量级、小型化设备在实时三维重建时依然存在精度差、鲁棒性差、地图占据大量存储空间等问题。本文针对上述问题主要开展了以下工作:首先,分析了视觉三维实时重