论文部分内容阅读
本文采用自适应神经模糊推理系统(Adaptive neuro-fuzzy inference system,ANFIS)进行碳通量模拟,以期获得较准确模拟,为碳通量研究提供一定的研究方法。基于八达岭站点2015至2017年数据,使用均基于集成学习的随机森林(Random forest,RF)、梯度提升决策树(Gradient boosting decision tree,GBDT)进行特征选择。基于特征选择结果,使用RF、GBDT、均基于不同内部函数的反向传递神经网络(Back propagation neural network,BPNN)、支持向量机(Support vector machine,SVM)、ANFIS进行碳通量模拟。使用决定系数(Coeffcient of determination,R2)、一致性指数(Index of agreement,IA)等指标进行模型评估,选出各个方法的最优模型并对比性能,分析ANFIS模拟可行性和不同内部函数的性能。综合RF和GDBT特征选择结果,全部因子作为输入,RF与GDBT的训练集与测试集R2均在0.79和0.77左右,选择出的5个重要因子分别为光合有效辐射、2号位置10cm 土壤温度平均值、2m处相对湿度平均值、2m处空气温度平均值、4号位置土壤含水量平均值。综合碳通量模拟结果,在ANFIS的内部隶属函数中,高斯函数优于广义S形函数,基于2个高斯函数的ANFIS与基于3个高斯函数的ANFIS性能相当。最优模型为基于2个高斯函数的ANFIS,其训练集与测试集R2为0.768和0.756,IA为0.928和0.922。在集成学习中,RF优于GDBT,其性能与ANFIS最优模型相当。在SVM的内部核函数中,高斯函数优于多项式函数和标准S形sigmoid函数。最优模型为基于高斯函数的SVM,其训练集与测试集R2为0.687和0.680,IA为0.903和0.900。在BPNN的内部激活函数中,tanh函数优于标准S形sigmoid函数。最优模型为基于tanh函数的BPNN,其性能与SVM最优模型相当。四个方法的最优模型在八达岭碳通量上的模拟结果表明,(1)ANFIS与RF性能相当且优于BPNN和SVM,ANFIS没有复杂的调参过程,在碳通量模拟领域具有一定的可行性。(2)综合BPNN、ANFIS、SVM的内部函数模拟结果,高斯函数优于S形函数,tanh函数优于标准S形sigmoid函数,广义S形函数优于标准S形sigmoid函数。(3)ANFIS性能与内部隶属函数个数不是正相关关系。(4)对比基于5个因子输入与全部因子输入的RF和GDBT模拟结果,5个因子贡献率约98%,验证了特征选择的正确性。