论文部分内容阅读
随着对地观测技术的不断发展,遥感影像的分类在军事、农业等领域发挥着重要的作用。传统的遥感影像分类方法需要人工设计特征和参数,使得模型的泛化性差且分类精度低。深度学习作为一种新兴的技术,在图像分类领域取得了突破性进展,它能够自动的学习图像的深层特征,具有较高的识别准确率。由于深度学习模型参数较多,一般采用GPU服务器对其进行训练。但是遥感影像数据量较大,单GPU服务器无法高效的管理海量遥感影像。因此,本文提出了一种基于分布式存储的海量遥感影像分类方法,该方法将分布式文件系统作为底层的存储架构,在上层采用GPU服务器训练改进后的遥感影像分类模型。论文的主要研究内容如下所示:(1)为解决单GPU服务器无法高效地管理海量遥感影像的问题,本文提出了一种基于HBase的海量遥感影像并行处理方法。其利用HDFS分布式文件系统和分布式数据库HBase构造了面向遥感影像应用的并行处理架构,对大规模遥感影像进行管理。本文采用希尔伯特曲线和网格索引相结合的索引方式,保证遥感数据在HBase的物理存储结构上具有较高的空间临近性。同时在影像金字塔的构建和数据存储的过程中,本文提出了一种基于MapReduce的并行处理方法,有效的减少了数据的存储与读取时间。实验结果表明,基于HBase的并行处理遥感影像的方法,可以快速的处理大规模遥感影像。与Oracle和MongoDB存储方法相比,该方法具有较高的扩展性和较短的处理时间,能够为大规模遥感影像的分类提供良好的数据管理服务。(2)为了减少遥感影像分类模型的训练时间和提高分类精度,本文提出了一种基于迁移学习改进的U-Net网络模型。该方法首先基于分布式存储结构设计了一种并行采样算法MRSW,其充分利用了遥感影像金字塔数据,缩短了训练数据的构造时间。然后采用VGG16模型的卷积参数用于初始化U-Net模型,加速了模型的收敛速度;为了避免模型产生过拟合,本文对U-Net模型下采样前和上采样通道合并后进行Batch Normalization操作;由于遥感影像中类别分布不均衡,导致模型的分类精度较低,本文将用focal loss扩展到多分类作为损失函数,增加错分样本的损失权重提高了模型的分类精度。实验结果证明,本文提出的基于迁移学习改进的U-Net模型在训练过程中更加稳定,在减少模型训练时间的同时具有较高的泛化能力。其在测试数据集上可达到94.12%的准确率,较原始U-Net模型提高了 5.88%。