论文部分内容阅读
随着遥感设备和技术的快速发展,我们可以通过多光谱/高光谱图像和合成孔径雷达来得到更多深入观察地球的机会。遥感设备帮助我们捕捉到越来越多不同类型、不同分辨率(空间分辨率、光谱分辨率和时间分辨率)的机载或卫星图像。这些图像的高维度成为甚高分辨率(Very High Resolution,VHR)场景分类的巨大挑战之一,同时也要求采用更有效的方法来实现土地利用及覆盖的图像场景分类,这也是遥感图像领域中最重要的任务之一。VHR图像场景分类中最重要的一步是特征提取,它将图像场景表示成特征向量的形式。根据像素级/图像级的表示可以将已有的VHR图像场景描述方法分成三类,这些方法都直接依赖于图像场景的全局表示。本文我们关注于VHR图像场景分类中的特征提取方法,提出能够对VHR图像场景中带有不同几何性质的区域如机场、建筑、森林等进行准确分类的技术。目前已有若干应用与监控人类活动下的自然环境密切相关,而VHR图像则为他们提供了非常有用的信息。VHR图像场景分类致力于提取能够表示目标区域的特征,但与VHR图像相关的大规模数据却使得分类问题变得非常复杂,而目前可用的方法仍然不足以来分析这类遥感数据。基于此,为了增强自动提取VHR图像场景中有用特征的能力,本文的总体目标是提出创新的技术来对VHR图像进行分析和分类。具体来讲,本文主要考虑以下几个问题:(1)如何从大量的VHR数据中得到优异的特征表示,这对于VHR图像场景分析而言仍然是一个重要的任务。为了提取更为有效鲁棒的特征来对图像场景进行分类,我们提出了一个基于稀疏手工特征选择的VHR场景分类方法。首先,我们通过手工设计的方法从原始的VHR图像中提取局部特征来构造一个视觉词典。接着,稀疏主成分分析法(sparse Principal Component Analysis,s PCA)被用于从这个视觉词典中学习对应于每一类的代表特征集合。最后,我们采用这些稀疏的低层特征来表示图像场景。(2)针对VHR图像分类任务,我们提出了一种称为显著块采样的方法。实际应用中,s PCA稀疏主成分分析法被用来为图像场景表示选择对应的显著块。这种方法在场景理解中是十分高效和鲁棒的。(3)根据特定的语义类别集合来标注VHR图像场景是一件十分重要的任务。考虑到属于同一类别的地表可能有着非常大的变化,且目标可能出现在不同的尺度和方向上,我们提出了一个基于CNN模型的VHR图像语义分类方法。首先,我们采用在Image Net数据集上预训练的VGG模型来对原始的VHR图像提取特征。接着,VGG网络的全连接层输出将被联合起来形成VHR图像场景的最终表示。之后,我们采用基于判别相关分析的特征融合策略来对VGG网络提取的原始特征进行优化。相较于传统的特征融合策略,这种融合方法效率更高。(4)尽管已经存在一些工作利用深度特征来对VHR图像场景进行表示,但是如何优化从CNN模型到VHR图像场景理解的迁移过程依然是一个十分具有挑战性的问题。我们提出了一个简单高效的方法来探索CNN网络不同层的优势。为了表示VHR图像内容的语义和背景信息,我们采用CNN模型来从原始的VHR图像场景中提取特征。接着,我们采用基于编码的方法在CNN模型的卷积层特征上生成对应于输入图像的视觉单词。我们对VHR图像场景分类的相关文献进行了深入的研究,并在2.1节就现有方法的局限性进行了说明。为了解决这些问题,我们提出了若干创新方法,并在真实遥感图像上进行了实验验证。大量的实验结果表明,本文所提出的方法在VHR图像场景分类任务上是十分有效的。