论文部分内容阅读
近年来,随着传感器技术的飞速发展,可获取的遥感影像的空间分辨率不断提高,高分辨率对地观测系统逐渐形成并日趋完善,并成为国家战略发展方向之一。与此同时,准确高效的遥感信息提取手段已成为遥感应用中的关键环节。另一方面,以深度学习算法为代表的人工智能技术正引领者当下智能革命的浪潮,并逐渐成为国家战略竞争和行业转型突破的关键技术。目前,深度学习算法已经在图像分类、自然语言处理、降维、目标检测、运动建模、自动驾驶、机器人等领域取得前所未有的成果。基于这样的背景,本文以高分辨率遥感智能信息提取为突破口,针对高分辨遥感影像建筑物提取这一行业热门应用领域,采用深度学习领域前沿算法开展遥感信息提取研究,探索深度学习技术在遥感信息提取中的应用潜力,提高遥感信息提取精度和效率。本文以提高分辨率遥感影像智能化信息提取水平为目标,采用计算机视觉领域前沿的深度学习算法,研究了高分辨遥感影像上的建筑物提取技术。本文首先介绍了深度学习与CNN基础理论,包括深度学习与CNN的基本原理、CNN网络的特点和组成模块、神经网络优化算法以及CNN网络中使用迁移学习的基本原理。针对网络训练中可能出现的过拟合问题,本文介绍了几种常用的防止过拟合的手段。然后,本文针对当前高分辨率遥感影像分类中问题中存在的问题和挑战,设计和改进现有深度学习模型,提出了基于边缘加权CNN网络的建筑物提取模型和基于对抗学习网络的建筑物提取模型。具体来说,针对传统CNN网络特征提取能力不足的问题,本文设计了一个包含一百多个卷积层的CNN网络用于高度抽象的特征提取。同时,为了在这个非常深的网络中维持高频上下文特征,保证提取结果中建筑物边界能够与真实边界对齐,本文设计了一个边缘加权损失函数,迫使分割网络在训练过程中更多地关注边界像素,从而能够学习将分割图与真实边界对齐。紧接着,针对传统语义分割模型由于采用逐像素分类而忽略了像素之间高阶空间关联性问题,本文设计了一个对抗学习网络,它和基础分割网络同时优化训练,使得分割网络能够生成与真实建筑物标签图无法区分的预测结果。同时,为了避免传统对抗学习网络容易出现模型崩溃的问题,本文采用一种较为的稳定的对抗性网络训练策略来训练模型。最后,本文验证了上述建筑物提取模型在复杂城市场景中的效果,并针对提取结果中存在的像素较为破碎、建筑物单体不明晰的问题,设计了一种基于实例分割的建筑物矢量提取方法,并采用计算机视觉领域最为流行的实例分割算法Mask R-CNN算法来进行建筑物矢量提取。本文的创新点主要包括:(1)本文提出了一种基于边缘加权CNN网络的建筑物提取模型,该模型包含多个卷积层用于高层次抽象特征提取,并采用计算机视觉领域前沿的Dense Net结构作为基础架构。同时,采用瓶颈层和转换层压缩策略来压缩模型结构,提高模型计算效率。为避免由于网络过深导致高频细节信息丢失的问题,引入一种边缘加权损失函数使边缘像素获得更高的权重。本文的模型能够将直接边缘信息输入到分割网络中,从而迫使网络在训练过程中更多地关注对象边界并学习将提取的建筑物边界与真实边界对齐。(2)本文提出了一种基于生成对抗网络的建筑物提取模型。针对传统CNN的语义分割模型多采用逐像素分类网络模型,分割结果图无法考虑像素之间丰富的高阶空间关联性的问题,提出一种基于生成对抗网络的高分辨率遥感影像分类方法,并将其用于建筑物提取。对抗网络和基础分割网络对抗优化结果可以迫使模型生成无法与真实标签图区分的分割图。同时,为了避免传统生成对抗网络在优化过程中容易出现模型崩溃的问题,本文采用一种较为稳定的对抗性网络训练策略来训练模型。(3)本文提出了一种基于实例分割算法的建筑物矢量提取模型框架。在复杂城市场景中,传统分割算法提取的建筑物图层存在大范围破碎现象,难以通过后处理算法得到建筑物斑块矢量。本文从先实例化后分割的角度出发,探讨基于实例分割的建筑物提取方法。本文使用当下计算机视觉领域最为流行的实例分割算法Mask R-CNN来进行的建筑物矢量提取。