论文部分内容阅读
传统基于遥感数据提取的土地利用/覆盖信息包含像元或对象尺度地表覆盖的类别信息,而缺少邻域尺度的结构信息。对于具有复杂地表空间形态的城市区域而言,像元或对象尺度的土地利用/覆盖信息所包含的类别相对较少,难以反映复杂地表空间形态。因此,遥感数据所能提取的土地利用/覆盖信息与城市地表丰富的空间信息之间的不对等问题严重制约了遥感技术在城市研究中的作用。如何提取城市区域丰富的地表空间信息成为深化遥感技术在城市区域应用研究中的关键。高分辨率遥感技术能够获取包含详细地表覆盖信息和丰富局部结构信息的图像数据,为利用遥感数据提取城市复杂地表空间信息提供了可能。因此,本文基于国家自然科学基金重点项目“长时间序列遥感影像智能处理与地理过程时空分析”(41631176)和江苏省杰青项目“多尺度遥感信息协同处理与城市人居环境评价”(BK2012018)中对复杂地表空间信息解译的需求,以高分辨率遥感图像为数据源,探讨城市区域空间信息提取的新思路和新方法。针对高分辨率遥感图像复杂地表空间信息表达及处理单元问题,选择图像场景作为空间信息表达及处理的基本单元,重点研究了遥感图像场景深度学习特征提取及特征表达关键技术和方法,并将其应用于城市结构类型识别中。首先以“深度学习-特征编码-特征融合”为主轴开展了基于深度学习的遥感图像场景特征提取及表达方法研究,提出了更加适合遥感图像场景特征表达的方法。在此基础上,以场景为单元将所提出的场景特征表达方法应用于城市结构类型识别中,实现了城市结构类型空间信息的准确识别。研究中采用遥感图像场景标准数据集UCM和WHU_RS测试了遥感图像场景特征学习和表达方法的性能。最后以南京市部分区域作为研究区,利用IKONOS-2和SPOT7高分辨率遥感图像进行了城市结构类型识别应用研究。论文的主要研究内容和和结论包括:1)探索了基于深度学习进行遥感图像场景特征学习及表达的基本流程和关键技术,以两种典型的深度学习框架(稀疏自动编码器和深度卷积神经网络)为基础,针对不同深度学习模型提取的卷积特征提出或改进了相应的特征编码方法。基于场景单元进行空间信息提取首先要解决图像场景特征学习和表达问题,其目的是利用一组矢量特征对图像场景内容进行表达。深度学习作为目前计算机视觉领域最具潜力的方法之一,可以通过特征学习的方法挖掘图像局部信息,进而完成对图像场景内容的特征表达。然而,利用深度学习模型提取的图像卷积特征需要通过进一步的特征编码才能完成对图像场景的特征矢量化表达。针对稀疏自动编码器提取的密集卷积特征,构建了一种基于全局特征的编码方法(Global Feature Coding,GFC),在减少卷积特征维数的情况下有效地保证了图像特征表达能力,;针对深度卷积神经网络模型提取的卷积特征,构建了多尺度改进的Fisher 核特征编码方法(MultiscaleImprovedFisherKernel,MIFK),通过考虑图像尺度的多样性来提高图像特征表达能力。利用标准遥感图像场景数据集对深度学习及特征编码方法进行的实验评价,验证了所构建的编码方法的有效性,同时发现深度卷积神经网络模型比稀疏自动编码器在遥感图像场景特征学习和表达中更具优势。2)深度卷积神经网络模型可以提取场景图像的多层次特征,通过融合多层次特征对图像场景内容进行特征表达可以有效提高图像场景的特征表达能力。不同层次特征包含了图像场景内容的不同信息,具有明显的差异性和一定的互补性。然而,不同层次卷积特征的编码结果与全连接层提取的特征都属于高维特征数据,需要对多个高维特征数据进行融合表达来充分利用不同层次特征所包含的信息。针对该问题,提出基于监督型特征子空间学习的特征融合方法,实现了对多个高维特征数据的融合表达。实验表明:深度卷积神经网络模型提取的多层次特征融合表达有效提高了遥感图像场景内容的表达能力,并使图像场景分类精度得到了明显提升。3)针对不同模型网络结构和参数的差异性和互补性,通过融合不同深度卷积神经网络模型提取的特征进行综合表达,可以进一步提高图像场景的特征表达能力,尤其对标记样本不足的任务更加有效。基于监督型特征子空间学习的特征融合方法有效实现了对单个卷积神经网络模型所提取的多层次特征进行融合表达,但同时也降低了不同模型融合特征之间的差异性。通过综合利用监督和非监督特征子空间学习方法改进的特征融合算法可以有效保持不同模型特征之间的差异性,为实现多模型特征融合表达奠定了基础。结果表明:改进后的融合算法有效地平衡了多模型特征差异性和特征可分性之间的关系,有效提高了融合特征的表达能力,特别是可以显著提高标记样本不足情况下场景特征的表达能力。4)在对城市结构类型进行语义界定的基础上,以图像场景为处理单元,将基于深度学习的遥感图像场景特征表达方法应用于城市结构类型识别中,提升了遥感解译信息与城市分析需求之间的耦合程度。通过以南京市部分区域为研究区,利用两种高分辨率遥感图像进行城市结构类型识别应用,证明所构建的基于深度学习场景内容特征表达框架和方法是有效的。所提出的多层次及多模型深度特征融合表达和分类方法在研究区城市结构类型识别中获得了超过90%的分类精度,应用结果同时表明融合多模型特征进行图像场景内容表达在样本有限的应用中更具优势。该研究对基于高分辨率遥感图像进行城市邻域尺度空间信息提取具有实际应用和参考价值,为深化高分辨率遥感图像在城市区域研究中的应用提供了新的思路。