论文部分内容阅读
水稻作为我国的种植面积最大、总产最多的粮食作物,它的种植面积变化历来受到各级政府和社会大众的高度重视,也是国家和区域制定粮食政策和经济发展计划的重要依据。因此,准确的获取水稻生产信息,正确及时地掌握农作物生产状况,对粮食安全具有十分重要的现实意义。据统计,全世界共有约四分之一至三分之一的淡水资源被用于稻田灌溉。此外,稻田也是甲烷(CH4)的重要来源,对全球温室效应产生重大影响。因此,大范围水稻种植区制图对于指导水稻种植,水资源利用,气候变化和政府决策具有重要意义。西南丘陵山区由于受田块破碎、耕作制度差异、复杂地形和遥感数据质量等因素的影响,一直缺乏有效准确的水稻空间分布的监测手段。最近,卷积神经网络方法在土地利用/覆盖遥感分类领域已取得很好的表现,但尚未被应用于丘陵山区的水稻空间分布提取中,而且多数研究缺乏对卷积神经网络和其他经典机器学习模型的分类性能以及可迁移性能的比较。本研究以重庆市巴南区和忠县为研究区,基于三期共六幅无云覆盖Sentinel-2影像数据(2017年4月14日(移栽期)、7月23日(抽穗中后期)、10月31日(水稻收割后)),提取六个常用光谱波段特征(Blue,Green,Red,NIR,SWIR-1和SWIR-2)和四个光谱指数特征(归一化植被指数,地表水分指数,改进归一化差异水体指数和改进土壤调整植被指数)组成特征数据集,并借助纯像元提取算法提取水稻和非水稻样本,设计实验确定最优时相特征组合,然后基于最优时相组合设计本地实验和迁移实验两类实验旨在评价(1)基于大量标注样本的八种机器学习分类模型的水稻种植面积监测性能;(2)在一个研究区预训练的机器学习分类模型迁移到另一研究区的迁移分类性能。此外选用召回率,准确率,总体精度和F1分数评估分类准确性。八种分类模型包括四种卷积神经网络(一维(one-dimensional,简称Conv-1D)、二维(two-dimension,简称为Conv-2D)和三维卷积神经网络(three-dimensional convolutional neural networks,简称为Conv-3D_1和Conv-3D_2))和四种非卷积神经网络模型(随机森林(Random Forest,简称RF)、支持向量机(Support Vector Machine,简称SVM)、多层感知机(Multi-Layer perceptron,简称MLP)和极度梯度提升(eXtreme Gradient Boosting,简称XGBoost))。主要研究结论如下:(1)全时相组合实验(Apr&Jul&Oct)中所有分类模型的F1分数都要高于单时相特征实验(Apr,Jul和Oct)和双时相组合实验(Jul&Oct,Apr&Jul和Apr&Oct)中对应分类模型。由此可见,研究区水稻空间分布提取的最优时相特征组合为全时相特征组合。此外,在单时相特征实验中,Apr中的所有分类器给出的最低的F1分数;在双时相组合实验中,Jul&Oct中的分类模型优于Apr&Jul和Apr&Oct。(2)在本地实验中,Conv-2D分类模型在两个研究区均获得最高分类精度,F1分数分别为0.9086和0.9308,总体精度分别为95.60%和96.56%。Conv-1D分类模型的分类精度最低,F1分数分别为0.8048和0.7415,总体精度分别为89.87%和83.42%。总体上看,卷积神经网络分类模型的F1分数和总体精度高于非卷积神经网络分类模型(Conv-1D除外)。此外,在非卷积神经网络中,XGBoost和SVM分别在巴南区和忠县获得最佳结果,F1分数分别为0.8343和0.8502,总体精度分别为92.45%和92.69%。(3)在迁移实验中,所有CNN分类器都表现出很低的可迁移性。在忠县预训练的RF和XGBoost模型迁移到巴南区的F1分数分别为0.6382和0.6890,总体精度分别为0.8576和0.8723;在巴南区预训练的RF和XGBoost模型迁移到忠县的F1分数分别为0.6799和0.7187,总体精度分别为和0.8044和0.8153。由此可见XGBoost的迁移性能优于RF。此外对比本地实验,RF和XGBoost的迁移分类精度均低于本地分类精度。(4)由此可见,在标记样本可获取情况下,采用Conv-2D分类模型进行水稻种植区提取可以获得极佳的分类精度。在标记样本不可获取情况下,可以选用预训练的XGBoost模型进行水稻种植区提取,分类精度较高。(5)利用最优分类模型(本地实验中的Conv-2D模型)在忠县和巴南区进行水稻预测分布制图,预测种植面积分别为44.2万亩和35.1万亩,经检验面积精度分别为96.38%和95.44%。