论文部分内容阅读
遥感影像涵盖的目标范围广泛,既有尖锐边界且独立于背景环境的人造物体目标(如车辆、船舶、建筑物等),又有边界模糊且属于背景环境一部分的景观目标(如山地,丘陵区域),在军事目标精确打击、国防安全、土地资源调查、生态环境监测、自然灾害监测、地质灾害探测等领域有广阔应用前景。遥感影像目标检测技术是遥感影像处理与分析中的核心研究内容,旨在某个给定的遥感影像中,检测其是否包含一个或者多个感兴趣目标,并确定每个目标在图像中的位置。然而,由于视线角度、目标遮挡、复杂背景、光照强度、阴影图形等因素,势必引起目标物体在视觉外观上发生了较大变化,导致检测难度增大。因此,如何快速、准确地检测和提取遥感影像中各种复杂环境下的典型目标物,提高遥感影像数据的自动检测精度以及效率,已成为当前迫切需要解决的技术难题,且具有重要的学术价值和重大的工程意义。随着深度神经网络技术的突破,采用卷积神经网络进行特征提取与表示方法,在自然图像目标检测领域取得了巨大成功。但是,鉴于遥感影像与自然图像的差异性,该类方法并不能直接应用于遥感影像目标检测。为此,本文针对上述遥感影像目标检测问题,以基于深度学习及卷积神经网络的方法作为切入点,结合遥感影像自身的特点与难点,对遥感影像目标检测方法开展了深入系统的研究。首先,针对遥感影像中建筑物目标物的尺寸范围较大,而大多数目标检测识别方法都是采用尺度不变的模型结构,从而导致检测性能不佳的问题,提出一种基于多尺度候选区域融合网络的目标检测方法。该方法在候选区域生成阶段,通过多模型融合,构建一个多尺度特征金字塔结构,从而可以有效的生成尺度范围更广的候选区域图像块;在候选区域分类阶段,提出一种改进的图像分块投票算法,主要通过对图像块增加动态权重,实现抑制干扰图像块,增强目标图像块,从而有效地提升模型分类精度;在后处理阶段,提出一种有效的检测框去重算法,进一步提升模型的检测性能。此外,针对缺乏建筑物目标物的公共数据集的问题,构建了一个含有不同类型建筑物的新数据集,其目的在于训练模型以及验证模型在建筑物检测任务中的性能。最后,通过实验,验证提出的多尺度检测模型的有效性和鲁棒性。其次,针对遥感影像中多类别目标物检测较易混淆以及小目标检测效果不佳等问题,提出一种基于场景上下文特征金字塔网络的多类目标检测方法。该方法考虑遥感影像中目标一般出现在特定场景下的特性,构建一个将场景上下文特征与目标特征相融合的网络结构。该结构基于对多尺度目标具有较好检测性能的特征金字塔框架,通过建立和增强场景与目标物的关系,有效地提升多类别目标物的分类精度,从而提高检测精度。在此基础之上,进一步改进主干网络的网络单元结构,结合聚合残差单元结构和空洞卷积,形成了一个新的聚合残差空洞单元结构。提出的单元结构,相比于普通的残差单元结构,特征提取能力更强,对小目标物体检测更加敏感,有助于提高模型的检测识别精度。此外,考虑到遥感影像尺寸较大,导致训练模型时资源消耗过大。采用分组归一化层,将信道分为多组,然后计算每组内归一化的均值和方差,有效地解决一般模型中所采用的批量归一化层对资源的消耗过大的问题,并取得更好的检测性能。最后,针对遥感影像中,由于图像视角呈俯视角度,现有检测模型对密集型小目标物检测效果不佳的问题,提出了一种基于掩膜交并比非极大抑制法的目标检测方法。该方法在经典非极大抑制法基础之上,引入检测框掩膜信息,通过计算掩膜交并比,设计了一种新的动态的检测框去重阈值,从而实现更为精准的冗余检测框去重处理,有效地提升了检测模型对密集型目标物的检测效果。