论文部分内容阅读
云造成光学遥感影像上的相应区域信息畸变或者丢失,云掩膜是标记受云影响像素的过程,是正确使用遥感数据的基础。由于云的光谱与形状特征多样且差异很大,且数量分布不均匀,使得云掩膜成为遥感影像预处理中亟待解决的一个难题。近年来,蓬勃发展的深度学习方法为解决云掩膜问题提供新的技术思路。本文将云掩膜看成是从复杂背景(干净地物构成的下垫面)中提取感兴趣目标(云)的实例分割过程,发展一种基于改进Mask R-CNN的云掩膜方法,表现出良好的应用潜力。然而,Mask R-CNN应用于云掩膜时存在以下问题:(1)云的类型较多,不仅光谱特征和形状特征差异较大,且数量分布不均匀。以景为单位标记样本时,导致存在样本分布不均匀问题。从而导致小类别的云由于训练样本数量不足,分类器不能有效抓取其特征,从而导致漏提;(2)特征提取与掩膜的过程中网络进行了降采样操作,加之云与下垫面之间没有清晰边界,导致云(尤其是面积较大的云)的掩膜边界不准确。本文对原始的Mask R-CNN的云掩膜算法进行改进,并研发了智能化云掩膜系统,主要工作和结论如下:(1)本文提出了一种样本均衡化方法,以解决小类别由于样本数量不均匀而导致的漏提取问题。该方法将样本分为不同的训练批次,然后利用第一批次样本训练,并对第二批次样本进行掩膜测试,再将错检或漏检样本重新训练分类器。然后对所有批次样本重复上述过程,直到获得稳定的结果或者使用完所有类别的样本。(2)本文提出了一种基于Mask R-CNN的边界优化方法。针对掩膜大块云时结果边界不准确问题,提出了一种滑窗预测方法,减小了RoI Align所导致的边界定位误差,实现大块云的边界的精确提取,提高掩膜边界精度。最后本文选择了两个开源数据集和一个自标记数据集进行精度评价,结果表明本文方法获得的云掩膜相对于其他基于深度学习的云掩膜算法,在召回率、准确率、交并比、F1Score和整体精度具实现提升,且能够有效适应不同类型云的检测,提供了一种新的掩膜方法。相较于原始Mask R-CNN,本文方法在漏检率和边界定位精度均有较大提升,证明了本文方法改进的有效性。在未来的工作中,我们将进一步研究本文方法在数据集方面进行扩展,增强网络的训练效率和鲁棒性,建设一种可实际使用的云掩膜方法。