基于YOLOv3的小目标检测算法研究

来源 :南京邮电大学 | 被引量 : 9次 | 上传用户:jujumao222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是当今计算机视觉领域较为热门和流行的研究方向,可在各个领域中找到应用,例如国防、安全和医疗保障等。目前目标检测算法较多,如Fast R-CNN、Faster R-CNN、YOLOv3、SSD等。其中YOLOv3算法将目标检测看作回归问题对整张图片进行检测,这大大加快了检测速度,且主干网络采用残差结构大大加深了网络深度,使检测准确率相当。但这些算法对图片中面积占比小于0.12%的小目标检测的漏检率要高于大目标,YOLOv3也不例外。针对这一问题,本文基于YOLOv3网络模型研究了小目标检测算法,主要工作如下:(1)小目标在图像中所占像素很少,经过多层卷积之后提取得到的特征不明显,为了改善YOLOv3的小目标特征提取性能,通过将原网络模型中经2倍降采样的特征图进行卷积分别叠加到第二及第三个残差块的输入端,以此增强浅层特征信息。同时,在第一个8倍降采样的特征图后连接RFB模块,增强特征提取能力。(2)原网络中采用多次步长为2卷积操作代替池化层来进行特征图的下采样操作,降低了特征的传递能力。为此,本文借鉴Dense Net的思想,采用密集连接的方式将浅层特征图直接传输到深层同尺度卷积层的输入端。这样不仅能增强浅层特征重用能力,而且还可以有效缓解梯度消失问题。(3)提出了基于泛化IoU的回归损失函数代替原回归损失函数。通过在损失函数中加入锚框与真实框中心点距离相关以及预测框与真实框面积相关的两个惩罚项,使预测框的定位更加准确;并同时解决了两框无交集时的梯度消失的问题。本文基于以上三点改进分别在PASVAL VOC数据集和VEDAI数据集上与原网络进行对比实验。训练过程中,在训练批次相同的条件下训练时长相当。实验结果表明,上述三点同时作用于原YOLOv3网络时,在小目标检测上具有更低的漏检率,定位更加准确,且检测速度相仿。
其他文献
为从胡萝卜籽中纯化具有较高活性的抗氧化肽。采用凝胶过滤色谱和反向高效液相色谱法对胡萝卜籽蛋白酶解液进行分离纯化,以DPPH自由基清除率为指标,最终获得2个活性较强的抗
我国人口老龄化指数逐步上升,且随着老年人身心机能与生活能力不断衰退,在信息技术快速发展的今天,大量智能产品渗透进老龄社会中。电视已经不是原来只能提供直播节目的家电,而是越来越智能化的占据每家每户主体的娱乐陪伴者。在这样一种“智能化妙的趋势下,为老龄社会做的智能电视交互设计也遇到了新的机遇和挑战。如今的智能电视拥有智能的操作系统,除了传统的直播节目以外,还可借助互联网拓展更多的功能,也正因为如此,商
未来学家托夫勒曾预言,垃圾革命将是影响人类生存发展的又一次浪潮。中国经过半个多世纪的发展成为了今天的世界第二大经济体,人民生活水平普遍提高。但经济的快速发展也带来
标准与专利的融合,本身技术上并不存在障碍,且有利于保持标准的最优性和最新性。但是,专利是法律规定的法定垄断权,本身便赋予专利权人一定的市场力量。标准,又具有网络效应
长期以来,人们为了追求经济利益,为了推动社会进步,一直在对长江流域进行开发与利用,但是却忽略了对长江流域的管理与保护。目前,我国虽然已经颁布了一些法律法规,但是在还原
如何更精确、更实时地检测早期火灾的发生是人类不断追求的目标。图像火灾探测的一个最关键问题就是使用分类器区分和识别火焰和其他干扰物。经典的支持向量机算法(SVM)是一