论文部分内容阅读
遥感影像的地类全自动解译是我国国土资源科学致力攻克的重大技术问题。近年来,随着以深度学习为代表的机器学习技术的飞速发展,将深度学习应用到遥感影像的自动解译,实现尽可能自动化的用地类型识别是目前科研人员重要的研究目标和方向。深度学习对应深度神经网络(Deep Neural Network,简称DNN)工作的前提是深度网络得到充分的训练,这一切需要大量的样本作为训练数据。传统上,训练图像多靠人工获取,手动标注,费时费力,工作量巨大,且容易受操作人员的工作情绪和工作疏忽的影响;同时,源数据资料少、样本生产难,成为制约深度学习在遥感影像解译领域广泛应用的因素。本文基于多样性、可扩展性的众源数据OSM、土地利用现状数据、手动标注的矢量数据及遥感影像数据,利用软件ArcGIS Pro导出训练数据工具(Export Training Data for Deep Learning Tool)生产样例图像,利用软件Microsoft SQL Server Management Studio 2008制作了样例库,最后利用深度学习模型进行了样例库的精度检验。本研究的主要研究内容及成果如下:(1)根据深度学习对遥感影像样例的基本要求提出本研究的样例构建原理:a.每个类别都有丰富的数据;b.对象类别是中国国家土地利用、土地覆盖分类标准分类体系与OSM类别体系的组合,每个类别的水平旨在进一步提高样本的多样性和综合性;c.土地利用具有不同的类型,按照中国土地分类标准建立,各阶层之间存在显著差异;d.整个系统的识别率高,可以避免模糊对象,提高图像质量;e.每个类具有不同的成像角度、大小、形状、颜色以增加样例多样性,这可以提高模型泛化性能和鲁棒性。(2)综合OSM(Open Street Map)现有分类体系、中国土地利用分类标准和地理国情普查分类体系构建了本研究的遥感影像样例库地物分类体系,包括耕地、园地、林地、草地、房屋建筑(区)、构筑物、铁路与道路、人工堆掘地、荒漠与裸露地、水域和地理单元11个一级类、28个二级类和25个三级类。(3)该样例库包括两个子样例库,单片尺寸分别为128×128像素和256×256像素。其中,128×128样例库具有大约19500个图像的样本,包含42个子类,平均每个类大约490个图像;256×256样例库具有大约16000个图像样本,包含37个子类,平均每个类大约420个图像。(4)利用构建出的样例数据进行深度学习模型训练,训练的精度在99%左右。基于训练的模型进行分类,精度为98.9%,初步成果令人鼓舞。