论文部分内容阅读
随着煤矿资源的开采,土壤重金属污染问题也逐渐加剧。研究煤矿区土壤重金属污染,对人类的健康以及社会资源可持续发展至关重要。传统的土壤重金属含量检测方法耗时耗力;高光谱成像仪波段众多、光谱分辨率高、信息量大,它的出现为矿区土壤重金属的反演研究提供了新的思路。传统的线性或非线性反演方法存在模型泛化能力不足、运行效率低等问题,由于随机森林融合了多棵决策树进行训练,预测性能有很大提高,成为近些年研究的热点。论文以江苏徐州铜山柳新矿区为研究区,采用ASD FieldSpec 3 Hi-Res地物光谱仪和Hyspex成像光谱仪对该区的土壤重金属含量进行估计,主要结论如下:(1)在基于实验室高光谱数据的土壤重金属定量估算研究中,采用局部相关最大去噪方法以及多种变量选择和建模方法进行。预处理结果表明,局部相关最大方法在最大化去噪的同时又能留存与重金属元素相关的光谱信息,可以得到更高的相关性和更多的相关性波段。对偏最小二乘模型、支持向量机模型、基于递归特征去除的支持向量机模型、The Least Absolute Shrinkage and Selection Operator、岭回归、弹性网络、岭回归系数筛选法以及随机森林、正则化随机森林、引导随机森林、引导正则化随机森林模型进行比较研究。反演结果表明基于随机森林的正则化变量选择方法可以提取出最优的波段,效率较高。对Cr的预测中,正则化随机森林最优,Rp2、RMSEp、MREp分别为0.8708,3.0687,0.0467;对Cu的预测中,正则化随机森林最优,Rp2、RMSEp、MREp分别为0.8215,3.7583,0.1657;对Pb的预测中,引导正则化随机森林最优,Rp2、RMSEp、MREp分别为0.8363,2.4325,0.1191。(2)采用ASD获取的原始光谱对大气校正后的Hyspex影像光谱进行重金属预测研究。室内反演结果表明,随机森林模型是最优的模型,对Cr的预测中,引导随机森林最优,Rp2、RMSEp、MREp分别为0.7179,15.8920,0.2530;对Cu的预测中,正则化随机森林最优,Rp2、RMSEp、MREp分别为0.6388,11.7921,0.8174;对Pb的预测中,引导随机森林最优,Rp2、RMSEp、MREp分别为0.3661,5.3969,0.3617;野外反演结果整体优于室内反演结果,并且随机森林模型表现最优,对Cr的预测中,正则化随机森林最优,Rp2、RMSEp、MREp分别为0.4113,15.0728,0.2473;对Cu的预测中,正则化随机森林最优,Rp2、RMSEp、MREp分别为0.4146,13.1818,0.9933;对Pb的预测中,正则化随机森林最优,Rp2、RMSEp、MREp分别为0.5710,4.9364,0.2719。(3)通过研究航空高光谱的混合像元分解问题,构建了基于混合像元分解的航空高光谱影像数据的重金属含量反演。解混光谱与原始光谱反演结果表明,前述的方法的反演精度均得到了提高,验证了混合像元分解在光谱反演中的有效性。在解混光谱反演中,对比分析各模型,随机森林能获取较好的反演精度,其中,对Cr的预测最优模型为正则化随机森林,Rp2、RMSEp、MREp分别为0.7358,6.0063,0.0965;对Cu预测中,引导正则化随机森林最优,Rp2、RMSEp、MREp分别为0.7017,7.2088,0.3734;对Pb预测中,引导正则化随机森林最优,Rp2、RMSEp、MREp分别为0.7424,2.8030,0.1385。将各个航空光谱预测模型提取的特征波段应用于航空影像重金属预测,实现重金属含量制图。结果表明,随机森林模型最稳定,预测的重金属含量值分布集中,均值与实测值接近,进一步验证了该方法的有效性。