论文部分内容阅读
建筑物是建筑智能普查、城市规划、不动产登记、城乡建设及城市安全等领域重点关注的人工地物之一,基于高空间分辨率遥感影像的建筑物信息提取具有重要研究意义和应用价值。尽管建筑物在高分辨率遥感影像上形状、布局等特征明显,目视解译时与其他种类地物较好区分,但是由于建筑物屋顶材质、建筑高度、建筑风格的多样性,基于高分辨率遥感影像的建筑物自动提取一直面临着严峻的挑战。目前依赖人工勾画建筑物轮廓的方式虽然精度较高,但效率低下,无法大范围推广。基于人工筛选特征的传统机器学习算法和卷积神经网络(Convolutional Neural Network,CNN)算法的逐像素预测建筑物的方式虽然较人工标注速度有所提升,但是往往精度较差。针对以上现有研究的不足,本文在对现有的全卷积神经网络(Fully Convolutional Networks,FCNs)算法进行对比和分析的基础上,引入能够捕获上下文特征的注意力机制对UNet++进行改进,提出了一种注意力嵌套U型网络AUNet++用于建筑物提取。本文的主要研究内容和成果如下:1)采用INRIA航空图像标记数据,构建了基于FCNs的高分辨率遥感影像建筑物自动提取数据集,该数据集覆盖范围广、数据量大。2)针对常用的全卷积神经网络FCN、U-Net、UNet++,分析其应用在建筑物上自动提取的效果。通过实验,验证了UNet++在建筑物自动提取方面的优越性。与FCN和U-Net相比,UNet++以72.05%的交并比和95.88%的总体精度成为最优的模型。且UNet++深监督的特性使得模型经过一次训练之后,可根据需求进行剪枝和部署。3)针对常用的FCNs仅能提取局部信息的缺陷,充分考虑空间上下文信息和人眼视觉的注意力机制,构建了AUNet++建筑物提取网络。引入期望最大化注意力和通道注意力来捕获遥感影像中的长程依赖关系,针对提取到的建筑物概率图描绘PR曲线和ROC曲线,定性的展示了AUNet++的优越性,AUNet++以0.9810的AUC和0.856的BEP获得最佳精度。4)针对提取到的建筑物二值图通过最少顶点压缩算法进行建筑物规则化后处理,得到规则的建筑物多边形轮廓,使建筑物电子底图的实时更新更加方便、快捷。实验结果表明:(1)UNet++相对于其他常见的全卷积神经网络在建筑物自动提取的任务中表现出了明显的优越性;(2)引入上下文特征的期望最大化注意力模块和引入通道权重的通道注意力模块后,本文提出的AUNet++建筑物提取模型的鲁棒性显著提升;(3)通过最少顶点压缩算法对建筑物进行后处理,进一步提升了建筑物轮廓的准确性。