论文部分内容阅读
精准的水体信息提取是水资源调查、干旱、洪涝等灾害探测的关键。随着遥感技术逐渐成熟,利用人造卫星传回的遥感图像捕捉并分析水体信息成为研究热点。目前,从遥感图像中抽取水体信息较典型的方法有三种:(1)操作简便且只需对单个波段的灰度值设定阈值的单波段阈值法;(2)谱间关系法:考虑多个波段,能够提取出部分基于单波段的方法无法识别出的细小水体;(3)通过对多个波段进行逻辑运算得出结果,基于一定的阈值对结果进行分割,准确获取水体信息的水体指数法。但大量研究显示,现有方法自动化程度较弱且具有区域局限性。对于拥有不同地形(山地、草原、湿地等)的区域,绝大部分方法依赖大量的先验知识及反复试验进行阈值设定。除此之外,还需要耗费人力进行特征过滤与优选。同时,现有方法提取的水体精度无法满足许多应用的需求。因此,如何在现有方法的基础上研究出高精度的水体信息自动化提取技术就显得尤为重要。首先,为了解决水体信息提取中的数据密集与计算密集问题,满足对实时性要求较高的应用的要求,将分布式并行计算理念引入水体识别中。利用多台主机构建Hadoop分布式集群,实现遥感数据的分布式存储和管理。选用合适的水体信息提取方法,构建基于分布式计算的水体信息提取模型,并选取渭干河流域作为研究区进行实验。实验结果表明,提出的模型较准确的从遥感图像中提取出水体信息,具有良好的可扩展性和伸缩性。其次,针对影响现有方法自动化程度的两大过程:阈值设定与特征选择,本文借助机器学习工具,提出了一种基于反向神经网络BP的自动化水体识别模型。将遥感图像中水体的多个典型特征共同作为输入元,对BP神经网络进行训练;利用模型的学习能力自动计算阈值;通过所得阈值实现水体信息提取。选取研究区域进行实验验证,所提模型自动化程度较高并具有较高的识别精度。机器学习模型与分布式算法的引入使得水体信息提取的速度、精准度、自动化程度都有一定的提升。但由于获取困难,用于模型训练的带标签数据(地面实测数据)相对较少,为海量遥感数据信息提取带来巨大挑战。深度学习模型具备与大脑类似的“学习能力”,它能够从用户向模型输入的初始特征数据中抽取出更深层次的特征,从而更好地描述目标物体。由于出色的特征学习能力,深度学习模型在遥感图像信息提取领域被广泛使用。因此,本文构建基于深度学习的水体信息抽取模型。考虑图像中邻近像素点与目标点的关联特性,设计并实现特征扩充算法。将图像原始特征与扩充特征相连接,共同训练深度学习模型,实现水体信息的正确提取。实验结果表明,基于深度学习的水体信息提取模型在性能上优于支持向量机(SVM)和传统的人工神经网络(ANN)。