论文部分内容阅读
叶面积指数(Leaf Area Index,LAI)是评价植物生长发育和健康状况的重要指标。快速、准确地获取植被叶面积指数是评估荒漠化区域植被生长状况和固碳能力的重要前提。荒漠化区域植被稀疏、地域广袤,传统人工调查获取叶面积指数的方式费时耗力;遥感影像结合地面调查样地构建叶面积指数反演模型可以弥补传统调查方式的不足。变量筛选方法和反演模型的选择是叶面积指数遥感反演的关键。因此,选择合适的特征变量筛选方法,对现有遥感反演模型进行改进,提高模型的估计精度和工作效率,对荒漠化区域叶面积指数遥感反演具有重要意义。研究以张掖市甘州区为研究区,利用分层随机抽样得到455个大小为30m×30m的样地,利用叶面积指数地面实测数据,结合Landsat 8 OLI遥感影像提取影像特征变量,采用线性逐步回归法和随机森林法进行特征变量筛选。研究提出随机森林优化kNN模型对传统的叶面积指数反演方法进行改进,利用两种特征变量筛选方法得到的变量组合分别构建反演模型对叶面积指数进行估测和空间分布制图。为了验证优化方法的有效性,同时构建多元线性逐步回归(Multiple linear stepwise regression,MLSR)、支持向量机模型(Support Vector Machine,SVM)、随机森林模型(Random Forest,RF)、普通kNN模型(k-Nearest Neighbors,kNN)和距离加权kNN模型与优化模型进行精度对比分析,探讨适合荒漠化区域植被叶面积指数反演的方法。主要研究结论包括:(1)红、近红外及短波红外波段组合所得的特征变量与叶面积指数存在显著相关性,对提高模型反演精度有重要贡献。利用Landsat 8 OLI遥感影像和叶面积指数实测样地数据提取特征变量,共有259个特征变量与叶面积指数显著相关。相关系数绝对值在0.500以上的特征变量有128个,相关系数绝对值前五的特征变量为SR435、SR425、ARVI、SR415 和 NDVI,相关系数分别为-0.745、-0.744、0.743、-0.742 和0.739。(2)线性逐步回归法和随机森林法筛选出来的两组特征变量之间没有显著性差异。两种方法筛选的特征变量分别为SR435、SR51、B5和SR537、SR527、SR517、SR546、SR547、SR415、SR534、SR536、SR315、NDVI、Elevation、SR56。以上变量均主要由近红外、红、绿和短波红外波段组合计算而来,且基本来源于相关系数和重要性高的特征变量,说明这些波段对于LAI反演较敏感。考虑不同波长组合的特征变量能更好地进行LAI反演。(3)在两种特征变量筛选方法中,线性逐步回归法整体优于随机森林法。对于线性逐步回归法和随机森林法筛选出的变量组合构建的所有非参数模型、非参数优化模型和多元线性逐步回归模型,普通kNN、距离加权kNN和随机森林优化kNN模型在线性逐步回归法的表现要优于随机森林法。但对于随机森林模型,由于随机森林法是基于特征变量在随机森林回归中贡献度进行变量筛选,建模效果要显著优于线性逐步回归法。不同的特征变量组合对于反演模型的适用性不一致,在反演过程中,需要根据样本和模型特征选择合适的特征变量筛选方法。(4)随机森林优化kNN模型反演效果显著优于其他模型。在建立的所有反演模型中,随机森林优化kNN模型在两种特征变量筛选方法中R2分别达到了 0.783(RMSE=0.409,rRMSE=42.2%,MAE=0.246)和 0.762(RMSE=0.441,rRMSE=45.3%,MAE=0.252),RMSE、rRMSE和MAE均低于其他模型,估测精度显著优于其他模型。随机森林优化kNN模型的rRMSE相对于估测效果最差的普通kNN模型分别减少了 24.8%和28.4%,改进效果显著。同时,模型产生的残差较随机地分布在X轴两侧,大部分残差绝对值在1以内,表明模型结果可靠、预测效果较好。(5)随机森林优化kNN模型的叶面积指数空间分布与实际叶面积指数分布情况基本一致,制图效果在所有模型中表现最好。将Landsat 8数据结合地面实测样地LAI,利用多种反演模型得到30m分辨率的甘州区叶面积指数空间分布图。多元线性逐步回归模型和支持向量机模型均产生了不合理估计值,即存在小于0的估计值。通过线性逐步回归法构建的随机森林优化kNN模型所得到的LAI空间分布更接近实际情况。结果显示中部和西部地区植被LAI值多数大于1,北部地区为戈壁,LAI值较低。南部地区主要为稀疏的草地,LAI值分布范围为0-1。随机森林优化kNN模型制图效果优于其他模型,能为荒漠化区域叶面积指数反演提供参考。研究成果可用于植被生产力、蒸散量和净初级生产力的模拟,有助于更好地理解生态系统的一般过程。