论文部分内容阅读
土壤作为陆地生态系统中的重要碳库,能够与大气中的二氧化碳进行交换,对全球温室气体的排放产生重要影响。土壤中的碳大约是大气中的三倍,主要以有机碳的形式存在,即土壤有机碳(soil organic carbon,SOC)。SOC作为评价土壤质量的关键指标,是农业土壤的重要参数。因此,定期监测以实现SOC含量空间分布制图具有十分重要的意义。传统测量样本点的方法耗时且成本高昂,并且实验室土壤反射光谱只能提供有限区域范围的光谱数据,均不适宜大规模监测,而遥感数据易获取,覆盖范围广,可实现全年的地面监测,在SOC预测中具备突出优势。特别是重访时间短、空间分辨率高且拥有高质量物理校准数据的Sentinel-1和Sentinel-2卫星,可提供大量卫星影像数据,为实现SOC精准预测提供数据支撑。本研究以重庆市万州区长江以北区域为研究区,依据果园、旱地和水田采集的565个土壤表层样本,将合成孔径雷达卫星影像(Sentinel-1)、光学卫星影像(Sentinel-2)和数字高程模型(digital elevation model,DEM)数据作为输入变量,基于梯度提升回归树(gradient boosting regression tree,GBRT)、支持向量回归(support vector regression,SVR)、随机森林(random forest,RF)和极端梯度提升(extreme gradient boosting,XGboost)方法构建具有不同特征变量组合的预测模型。此外,采用决定系数(R~2)、平均绝对误差(MAE)和均方根误差(RMSE)评估模型的预测精度,然后选择最优预测方法和特征组合对SOC含量进行预测,旨在探索雷达和光学卫星影像在SOC预测中的协同作用和揭示遥感影像数据对不同土地利用类型SOC含量预测的重要性。(1)遥感变量从2020~2021年的Sentinel-1和Sentinel-2数据中提取。包括Sentinel-1数据中的两种后向散射系数:垂直-垂直(Vertical–Vertical,VV_1~VV_12)和垂直-水平(Vertical–Horizontal,VH_1~VH_12)极化,Sentinel-2数据中的10个光谱波段(B2、B3、B4、B5、B6、B7、B8、B8A、B11和B12),4个土壤辐射指数和20个植被辐射指数。土壤辐射指数分别为:亮度指数(BI)、第二亮度指数(BI2)、红度指数(RI)和颜色指数(CI);植被辐射指数分别为:土壤调整植被指数(SAVI)、转换土壤调整植被指数(TSAVI)、修正土壤调整植被指数(MSAVI)、二次修正土壤调整植被指数(MSAVI2)、差异植被指数(DVI)、比率植被指数(RVI)、垂直植被指数(PVI)、红外百分比植被指数(IPVI)、加权差异植被指数(WDVI)、转换归一化植被指数(TNDVI)、绿色归一化植被指数(GNDVI)、全球环境监测指数(GEMI)、大气阻抗植被指数(ARVI)、归一化差异指数(NDI45)、梅里斯陆地叶绿素指数(MTCI)、修正叶绿素吸收率指数(MCARI)、红边拐点指数(REIP)、反向红边叶绿素指数(IRECI)、色素特定简单比率算法(PSSRa)和归一化植被指数(NDVI)。地形变量以30 m分辨率的DEM为数据源,包括高程、坡度和坡向。基于以上变量构建SOC含量预测模型,Model A:Sentinel-1+Sentinel-2(春)+DEM、Model B:Sentinel-1+Sentinel-2(夏)+DEM、Model C:Sentinel-1+Sentinel-2(秋)+DEM、Model D:Sentinel-1+Sentinel-2(冬)+DEM。(2)基于不同机器学习方法的SOC预测结果表明,XGboost方法在果园、旱地和水田SOC含量预测中的精度均为最高。具体表现为:果园SOC预测中的R~2排序为XGboost>RF>GBRT>SVR;在旱地中,R~2的排序为XGboost>GBRT>SVR>RF;在水田中,R~2的排序为XGboost>GBRT>SVR>RF。(3)基于最优预测方法(XGboost)和不同预测模型(Model A、Model B、Model C和Model D)的SOC预测结果表明,基于Model A的SOC含量预测在果园、旱地和水田中均为最高精度。在果园中,R~2的排序为Model A>Model C=Model D>Model B;在旱地中,R~2的排序为Model A>Model B>Model D>Model C;在水田中,R~2排序为Model A>Model B>Model D>Model C。结果显示,光学卫星影像的采集时间对SOC的遥感预测具有显著影响,春季Sentinel-2数据是SOC含量的有效预测变量。(4)基于最优方法(XGboost)和模型(Model A)的不同土地利用类型SOC含量预测结果表明,模型在果园中的预测精度最高,在旱地和水田中的预测精度一般。果园SOC含量预测的R~2、MAE和RMSE值分别为0.78,0.10%和0.13%,重要性得分较高的变量为高程(DEM)、VV_4(Sentinel-1)、VH_9(Sentinel-1)和VH_5(Sentinel-1),表明Sentinel-1和DEM数据在果园SOC含量预测模型中的重要性高于Sentinel-2数据。旱地SOC含量预测的R~2、MAE和RMSE值分别为0.49、0.16%和0.19%,关键预测变量为SAVI(Sentienl-2)、VH_4(Sentienl-1)、VV_5(Sentienl-1)和B11(Sentienl-2),表明Sentienl-2数据对旱地SOC含量预测的贡献大于Sentienl-1数据。水田SOC含量预测的R~2、MAE和RMSE值分别为0.59、0.17%和0.21%,对模型贡献较大的变量分别为VH_4(Sentienl-1)、MTCI(Sentienl-2)、VV_2(Sentienl-1)和BI(Sentienl-2),表明水田中Sentinel-1数据的重要性高于Sentinel-2数据。(5)基于XGboost和Model A在研究区进行SOC含量空间分布制图,果园中的SOC含量平均值为0.73%,含量变化范围为0.39%~1.73%;旱地中的SOC含量平均值为0.74%,含量变化范围为0.29%~1.42%;水田中的SOC含量平均值为0.92%,含量变化范围为0.44%~1.52%。SOC含量的空间分布情况表明,果园、旱地和水田中的SOC含量均具有明显的高、低值聚集特征。