论文部分内容阅读
土壤有机碳(soil organic carbon)简称“SOC”,是指土壤中存在各种形式和状态的碳化合物。土壤有机碳含量和碳密度是衡量植物生长各种必需营养微量元素的主要来源,是衡量植物土壤生长肥力的重要指标,也是土壤退化生长状态的重要指标。农田中的土壤大气具有比较高的固氮化碳潜力,并且由此可以有效地大幅减少农田大气中有机二氧化碳(CO2)的含量浓度,其中有机碳含量密度是作为判断一个该农田土壤大气质量状况极其重要的测量指标之一。由于目前土壤有机质中碳的浓度是衡量我国土壤质量逐渐下降的重要科学指标,因此,通过对土壤有机碳进行高光谱遥感分析,了解土壤有机碳结构的时空变化,可以快速有效地监测土壤退化,并为该地区防治土壤退化奠定基础。南疆位于我国西北部,天山以南,地处干旱半干旱的荒漠,腐殖质合成及有机碳分解对土壤的影响很大。南疆的土地资源广泛,是我国农业重要地区。本研究以南疆阿瓦提、温宿、和田、新和的农田土壤为研究对象,对实验室内测量光谱数据做处理与分析,土壤光谱数据进行包括原始数据在内的6种数学变换,为选出较优的光谱变换形式,分析对比所有模型精度,基于原始光谱数据及其光谱变换数据建立基于全波段的主成分分析(PCR)、偏最小二乘法(PLSR)、BP神经网络模型、支持向量机(SVM),对不同模型的预测精度进行比较分析,选出最适合该区域的有机碳估算方法。主要研究结论如下:(1)运用MATLAB对土壤有机碳含量的高光谱特征进行分析,根据分析结果发现,(1)总体波段介于0~45 g kg-1之间;不同有机碳含量下土壤的光谱曲线在形态上基本相似,呈现出上下平行的趋势,光谱曲线的总体变化比较平缓,呈现出明显的三个光谱吸收区间,吸收峰(波谷)分别在2500nm、以及3 600nm附近。(2)有四个比较弱的吸收谷,这四个波段分别为1 230 nm、1 550 nm、1750 nm和1 840nm,主要是由于土壤水分子以双频振动产生的;在在3 700~4 000 nm范围内,光谱曲线以波浪式显示,主要原因是土壤样本中的少量与空气中的水分吸收。(3)总体上看土壤有机碳含量随着波长的增加而不断增大,其中在1 650~2 340 nm与2 500~2 700 nm波段范围上升速度比较明显。(2)运用MATLAB对土壤有机碳与高光谱数据的相关性进行分析,根据分析结果发现,土壤有机碳含量与原始数据、SG平滑、线性基线校正只有正相关,原始数据与SG平滑710~962 nm、1258~1 392 nm、1 686~2 645 nm、3 621~3 999 nm波段的相关性通过0.01水平上的显著性检验,且最大正相关系数位于1 686~2 645 nm波段,相关系数达到了0.502;线性基线校正只在1 686~2645 nm、3 621~3 999 nm波段的相关性通过0.01水平上的显著性检验,最大正相关系数位于1 686~2 645 nm波段,相关系数达到了0.486;而光谱原始数据经过归一化、SG平滑+归一化、SNV变换后,不仅有正相关,还有负相关,这三种变换形式在1 756~2 041 nm、2 468~2 605 nm波段呈正相关,在1 033~1 210 nm、1 492~1 565 nm波段呈负相关,且在1 756~2 041 nm、2 468~2 605 nm、1 033~1 210 nm、1 492~1 565 nm波段的相关性通过0.01水平上的显著性检验,最大正相关系数位于1756~2 041 nm波段,相关系数达到了0.527,最大负相关系数位于1 033~1 210 nm波段,相关系数达到了-0.410。光谱原始数据经过归一化、SG平滑+归一化、SNV变换后所得到的光谱数值与土壤有机质含量相关系数与SG平滑、线性基线校正变换后相比均有提高。原始数据、SG平滑、线性基线校正与有机碳含量相关性的连续性较差,正相关和负相关的规律性较弱。而经过归一化、SG平滑+归一化、SNV处理后,有机碳含量的相关性看起来更简单、更具连续性。(3)运用The Unscrambler 10.5对光谱数据进行以下预处理:SG平滑、归一化、线性基线校正、SNV、SG平滑+归一化。根据数据预处理结果发现,土壤光谱反射率经SG平滑、归一化、线性基线校正、SNV、SG平滑+归一化等数据处理方式后,土壤光谱反射率明显发生了变化,光谱信息差异性变大,尤其是拐点位置。但是,基于土壤光谱曲线走势的相似性,经过不同数据处理的方法其光谱曲线走势大多一致。(4)运用5种预处理方法,并结合偏最小二乘法(PLSR)以及主成分回归法(PCR),来构建阿瓦提、温宿、和田、新和农田土壤有机碳的估算模型。研究结果表明:无预处理与5种预处理方法中,基于SG平滑+归一化处理的偏最小二乘(PLSR)模型精度最高,其R2为0.84,RMSE为3.47g kg-1,RPD为2.63;基于SNV处理的主成分回归(PCA)模型精度也较高,其R2为0.79,RMSE为3.9g kg-1,RPD为2.30;根据评价标准,这两种模型都具有较好的预测能力,但前者因其R2更大,RMSE更小,同时RPD也更高,从而具有更好的预测效果。因此,针对相同的数据处理方式而言,PLSR较PCR方法更适用于土壤有机碳含量的估算。(5)运用5种预处理方法,并结合支持向量机(SVM)以及BP神经网络,来构建阿瓦提、温宿、和田、新和农田土壤有机碳的估算模型。研究结果表明:无预处理与5种预处理方法中,基于SNV处理的支持向量机(SVM)模型精度也较高,其R2为0.83,RMSE为4.05 g kg-1,RPD为2.23;基于SG平滑+归一化处理的BP神经网络模型精度最高,其R2为0.82,RMSE为4.18 g kg-1,RPD为2.16;根据评价标准,这两种模型都具有较好的预测能力,但支持向量机(SVM)估算南疆农田土壤有机质含量的精度优于BP神经网络,前者因其R2更大,RMSE更小,同时RPD也更高,从而具有更好的预测效果.故而针对相同的数据处理方式而言,支持向量机(SVM)较BP神经网络更适用于土壤有机碳含量的估算,因此,利用高光谱数据构建的支持向量机(SVM)非线性模型来快速估算南疆农田土壤中的养分含量具有一定的可行性。(6)基于SG平滑+归一化处理后的偏最小二乘(PLSR)模型、基于SNV处理后的主成分回归(PCR)模型、基于SNV处理后的支持向量机(SVM)模型、基于SG平滑+归一化处理后的BP神经网络模型进行精度对比,基于SG平滑+归一化处理后的偏最小二乘(PLSR)模型的RMSEv最小、R2v最高、RPD最高。通过预测结果对比分析认为基于SG平滑+归一化处理后的偏最小二乘(PLSR)模型更适合用于南疆农田土壤有机碳含量估算。