论文部分内容阅读
为降低土壤重金属研究中人工采样成本,宏观掌握大尺度研究区内土壤重金属污染的空间分布特征,本文以贵阳市、遵义市和毕节市为研究区,镉(Cadmium, Cd)元素为研究对象,提出利用随机森林(Random Forest, RF)分析评估影响因子的贡献率,并根据贡献率进行影响因子筛选后构建极端梯度提升(eXtreme Gradient Boosting, XGBoost)模型,即RF-XGBoost模型,用以预测研究区内土壤Cd污染的空间分布特征。结果表明,研究区内土壤Cd含量平均值仅比贵州省背景值高出0.023 mg·kg-1,污染程度较低,变异系数为125.37%,属于强变异;研究区内对土壤Cd污染贡献率最高的影响因子为土壤侵蚀程度、高程和年平均气温,贡献率分别为0.100、0.088和0.084,说明在大尺度研究区中自然环境对土壤内Cd富集影响最大;RF-XGBoost模型的精度和稳定性高于RF和XGBoost模型,准确率提升了4.66%,Kappa系数分别提升了46.34%、4.21%,F1_score分别提升了61.42%、69.61%;研究区内土壤Cd污染整体程度较低,但在毕节市西南部出现多个中度-中强污染带。研究表明,RF-XGBoost模型可准确预测大尺度范围的土壤Cd污染空间分布,有助于宏观掌握土壤Cd污染的空间分布特征,为污染治理修复提供参考。