植被叶面积指数kNN优化方法反演研究

来源 :中南林业科技大学 | 被引量 : 0次 | 上传用户:yinxiaoyi5858
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
叶面积指数(Leaf Area Index,LAI)是评价植物生长发育和健康状况的重要指标。快速、准确地获取植被叶面积指数是评估荒漠化区域植被生长状况和固碳能力的重要前提。荒漠化区域植被稀疏、地域广袤,传统人工调查获取叶面积指数的方式费时耗力;遥感影像结合地面调查样地构建叶面积指数反演模型可以弥补传统调查方式的不足。变量筛选方法和反演模型的选择是叶面积指数遥感反演的关键。因此,选择合适的特征变量筛选方法,对现有遥感反演模型进行改进,提高模型的估计精度和工作效率,对荒漠化区域叶面积指数遥感反演具有重要意义。研究以张掖市甘州区为研究区,利用分层随机抽样得到455个大小为30m×30m的样地,利用叶面积指数地面实测数据,结合Landsat 8 OLI遥感影像提取影像特征变量,采用线性逐步回归法和随机森林法进行特征变量筛选。研究提出随机森林优化kNN模型对传统的叶面积指数反演方法进行改进,利用两种特征变量筛选方法得到的变量组合分别构建反演模型对叶面积指数进行估测和空间分布制图。为了验证优化方法的有效性,同时构建多元线性逐步回归(Multiple linear stepwise regression,MLSR)、支持向量机模型(Support Vector Machine,SVM)、随机森林模型(Random Forest,RF)、普通kNN模型(k-Nearest Neighbors,kNN)和距离加权kNN模型与优化模型进行精度对比分析,探讨适合荒漠化区域植被叶面积指数反演的方法。主要研究结论包括:(1)红、近红外及短波红外波段组合所得的特征变量与叶面积指数存在显著相关性,对提高模型反演精度有重要贡献。利用Landsat 8 OLI遥感影像和叶面积指数实测样地数据提取特征变量,共有259个特征变量与叶面积指数显著相关。相关系数绝对值在0.500以上的特征变量有128个,相关系数绝对值前五的特征变量为SR435、SR425、ARVI、SR415 和 NDVI,相关系数分别为-0.745、-0.744、0.743、-0.742 和0.739。(2)线性逐步回归法和随机森林法筛选出来的两组特征变量之间没有显著性差异。两种方法筛选的特征变量分别为SR435、SR51、B5和SR537、SR527、SR517、SR546、SR547、SR415、SR534、SR536、SR315、NDVI、Elevation、SR56。以上变量均主要由近红外、红、绿和短波红外波段组合计算而来,且基本来源于相关系数和重要性高的特征变量,说明这些波段对于LAI反演较敏感。考虑不同波长组合的特征变量能更好地进行LAI反演。(3)在两种特征变量筛选方法中,线性逐步回归法整体优于随机森林法。对于线性逐步回归法和随机森林法筛选出的变量组合构建的所有非参数模型、非参数优化模型和多元线性逐步回归模型,普通kNN、距离加权kNN和随机森林优化kNN模型在线性逐步回归法的表现要优于随机森林法。但对于随机森林模型,由于随机森林法是基于特征变量在随机森林回归中贡献度进行变量筛选,建模效果要显著优于线性逐步回归法。不同的特征变量组合对于反演模型的适用性不一致,在反演过程中,需要根据样本和模型特征选择合适的特征变量筛选方法。(4)随机森林优化kNN模型反演效果显著优于其他模型。在建立的所有反演模型中,随机森林优化kNN模型在两种特征变量筛选方法中R2分别达到了 0.783(RMSE=0.409,rRMSE=42.2%,MAE=0.246)和 0.762(RMSE=0.441,rRMSE=45.3%,MAE=0.252),RMSE、rRMSE和MAE均低于其他模型,估测精度显著优于其他模型。随机森林优化kNN模型的rRMSE相对于估测效果最差的普通kNN模型分别减少了 24.8%和28.4%,改进效果显著。同时,模型产生的残差较随机地分布在X轴两侧,大部分残差绝对值在1以内,表明模型结果可靠、预测效果较好。(5)随机森林优化kNN模型的叶面积指数空间分布与实际叶面积指数分布情况基本一致,制图效果在所有模型中表现最好。将Landsat 8数据结合地面实测样地LAI,利用多种反演模型得到30m分辨率的甘州区叶面积指数空间分布图。多元线性逐步回归模型和支持向量机模型均产生了不合理估计值,即存在小于0的估计值。通过线性逐步回归法构建的随机森林优化kNN模型所得到的LAI空间分布更接近实际情况。结果显示中部和西部地区植被LAI值多数大于1,北部地区为戈壁,LAI值较低。南部地区主要为稀疏的草地,LAI值分布范围为0-1。随机森林优化kNN模型制图效果优于其他模型,能为荒漠化区域叶面积指数反演提供参考。研究成果可用于植被生产力、蒸散量和净初级生产力的模拟,有助于更好地理解生态系统的一般过程。
其他文献
图像聚类是计算机视觉领域重要的无监督学习方法,图像数据的高维性以及内容的复杂性给图像聚类带来了巨大的挑战。一方面,传统的聚类方法通过对图像数据施加先验约束,在图像
重度抑郁症(Major depressive disorder,MDD)作为情绪性功能障碍中的一种,严重影响患者的生活质量,并为家庭和社会带来巨大负担;在我国的发病率较高,终生患病率为3.4%。阈下
病理图像分割是进行病理图像定量分析的重要基础,在疾病的研究、临床诊断、治疗和预后中具有重要的价值。传统的分割方法一般为手动或半自动的方法,在分割效率或准确性上远远
高光谱遥感图像是高光谱成像仪在电磁波谱的紫外、可见光、近红外和中红外区域,以数十至数百个连续且细分的光谱波段对目标区域同时成像得到的,同时包含地物的图像信息和光谱
作为计算机视觉中最基本的问题之一,目标检测因其在现实世界中的广泛应用地位而一直颇受关注,从其长达20多年的不断追求发展进步的历程来看,它代表了计算机视觉发展的历史缩
软件过程事件流数据(软件开发过程日志数据)因为其多平台性、异构性和单实例性等特殊性质不能直接用来进行软件过程的过程挖掘,并且现在已有的用于业务过程挖掘的算法不能直接使用软件过程事件流原始数据来进行软件过程挖掘[1,2],人们在进行软件过程挖掘前对软件过程数据的处理往往是根据需要自行进行处理,没有一个统一的格式和内容,因此造成软件过程挖掘结果质量较低,可用性不强等问题。因此本文对软件过程事件流进行建
在学生的英语学习过程中,学生在使用目标语言时不可避免地会犯各种错误。近几年来,口头纠错反馈一直是学术研究的焦点,它不仅为师生互动提供了机会,同时促使语言学习者会反思
《一个镇的保健品销售路》通过深度报道的形式,将四川省G市石河镇近千人走上卖保健品路的现象呈现给读者。作品通过镇上卖保健品人物的个人经历,他们为何入行为主线,深入挖掘入行背后的经济和社会原因。作品将个人的入行情感和想赚快钱的心理、小地方的血缘地缘影响、当地的经济情况等背后深层次的原因融合,深入报道群体性入行卖保健品背后的社会原因。作品阐述《浅析深度报道的叙事》以小论文的形式,结合《一个镇的保健品销售
神经网络是模拟大脑行为机制进行信息处理的数学模型,因其高度非线性特征和电路可实现性被广泛用于模式识别、组合优化、联想记忆等实际问题中。作为神经网络模型应用的前提,其动力学性质被广泛研究,包括无源性、稳定性等内在动态特性。无源性起源于电气网络理论和物理学的分支,其本质特征上是保持系统内部的稳定性,目前在电路系统、物理学、力学以及应用数学等领域有着广泛的应用。本文主要研究神经网络的无源性问题,分析了时
随着汽车保有量大幅提高,交通事故越来越频发,严重威胁人民财产和生命安全。绝大部分交通事故由异常驾驶行为导致。为了减少交通事故发生,安全辅助驾驶系统研究具有重大应该