论文部分内容阅读
近些年来,以计算机视觉技术为基础的卫星遥感技术发展迅速,光学遥感图像中的目标检测无论是在民用还是军事方面都具有重要的作用。在民用领域,高精度目标检测有助于辅助交通管理和城市规划;在军事领域,高精度的目标检测有助于精确锁定敌对目标入侵和危害,维护国家安全。然而图像分辨率高,目标尺寸小是当前高分辨率遥感图像在目标检测的重点和难点。深度卷积神经网络的应用解决了传统目标检测对图像特征提取能力的不足,使得目标检测精度有大幅的提升。但是无论是以YOLO(You Only Look Once)为代表的单阶段目标检测算法,还是以R-CNN(Region-based Convolutional Neural Networks)为代表的双阶段目标检测算法,都需要对高分辨率的遥感图像进行裁剪或者进行插值计算放缩到适应尺寸范围。裁剪导致特征提取后裁剪块边缘目标上下文信息丢失,并且过度裁剪会耗费更多的检测时间。而对图像进行插值计算放缩到固定尺寸,原始图像中小目标通过插值尺寸更小,通过深层的特征提取网络所得到的特征图,小目标特征消失,对小目标检测造成很大的困难。针对上述问题,本文结合深度卷积神经网络,提出一种适用于任意尺寸的高分辨率图像小目标检测算法。本文的主要工作如下:1.深入研究了卷积神经网络的基本概念及目标检测相关的技术原理,对近年来几种经典的基于卷积神经网络的目标检测算法进行分析,最终采用YOLOv3网络作为本文的基础网络架构。2.对采集得到的卫星遥感图像进行标注和清洗,结合公开数据集中挑选出来的数据样本,通过数据增强的方式进行数据扩充,建立本文所需数据库,并通过优化的K-means++算法计算本文实验中遥感汽车数据集的预设锚框;3.单阶段的YOLOv3网络由于下采样的限制,只能对图片固定尺寸输入网络。而本文提出一种适用于任意尺寸的图像小目标检测网络,该网络以YOLOv3网络为基础,在特征图拼接结构中使用特征图补丁,使得将原始图像输入网络时,检测阶段的特征图可以很好地和特征提取网络中同维度的特征图进行特征融合,弥补了 YOLOv3的不足,缩减了网络预处理和后处理操作,可以适应任意尺寸图像的输入。同时,增加在更大特征图上的检测网络,进一步提升网络对小目标和特小目标的检测能力。在保证检测精度的同时避免过度裁剪,缩短了大尺寸图像的检测时间。4.由于遥感汽车数据集目标背景复杂,并且存在汽车目标密集的场景,训练过程中极易出现正负样本失衡,本文采用focal loss替换原始的交叉熵损失,降低简单负样本在训练中所占的权重。同时,考虑到检测类别只有一类,权衡损失函数中类别损失和边框回归损失,加入一个加权因子,使网络训练过程中更加集中优化边框损失,提高了模型对单类别目标的检测性能。本文通过深度卷积神经网络对任意尺寸图像的小目标进行检测,是一种端到端的目标检测算法。减少了网络对原始图像进行预处理所造成的精度损失。并且针对本文遥感汽车数据集进行损失函数优化,在YOLOv3网络的基础上mAP提升14%,同时缩短图像整体的检测时间。