论文部分内容阅读
陆地生态系统碳水循环的研究是当前全球变化研究领域的核心问题,这些研究有助于预测将来的气候变化趋势以及评估陆地生态系统碳水循环对全球变化的响应与反馈,从而为寻求生态系统的有效管理和调控方法提供可靠的科学依据。观测和模拟是两种常用的估计全球碳水循环格局和变率、理解碳水循环的关键过程及其控制机制的研究手段。随着对陆地生态系统与大气间碳水通量长期的、连续的微气象观测数据的大量累积,如何合理地解释海量的通量观测数据和深度挖掘出观测数据中有用的知识,形成有效的基于通量观测网络数据的碳水通量模拟方法,是一个亟待解决的科学问题。因此,本文基于全球通量观测网络数据,利用机器学习技术对陆地生态系统的碳水通量进行模拟,并分别利用智能优化算法和数据预处理技术对这些机器学习方法进行改进。论文主要研究成果可概括为以下几个方面:(1)新提出的机器学习方法,包括广义回归神经网络(Generalized regression neural network,GRNN),极限学习机(Extreme learning machine,ELM),自适应神经模糊推理系统(Adaptive neuro-fuzzy inference system,ANFIS)和数据处理组合方法(Group method of data handling),都具有很强的非线性处理的能力来模拟和预测陆地生态系统中的碳水通量,同传统的人工神经网络(Artificial neural network,ANN)和支持向量机(Support vector machine,SVM)方法一样,都产生了可比较的评估结果。在模型的训练和学习的时间和效率上,相对于其它的机器学习方法,ELM方法具有很强的优势,而SVM模型在寻找最优参数的过程中消耗过多的时间;通过在四种典型的陆地生态系统上的比较,这些模型在常绿针叶林和落叶阔叶林的碳水通量评估中取得了最高的模拟精度,而在农作物生态系统上都给出了较低的模拟精度。(2)通过评价不同的内部函数对其各自的机器学习方法(ANN,ELM,ANFIS和SVM)在模拟长期的碳水通量上的影响,结果表明每一种方法的预测能力都强烈地依赖其各自的内部参数;ANN方法的训练函数对其泛化能力有很大的影响,没有一个ANN模型能够保证在所有的站点上都取得最优的模拟性能,最优的训练函数可通过试错的方式得到;对于SVM方法,径向基(Radial basis function)核函数都显著地优于多项式(Polynomial)和S型(Sigmoid)核函数;对于ELM方法,Sine和S型传递函数能够产生相似的评估,并且一致地优于Hard limit函数;对于ANFIS方法,减法聚类(Subtractive clustering)和FCM(Fuzzy c-means)算法一般地都优于最广泛使用的网格划分法(Grid partitioning)。并且对于网格划分法,没有一个隶属函数在所有的站点上都取得了最佳的模型效率。(3)根据智能优化算法对机器学习方法在陆地生态系统碳水通量评估中的改进研究,研究结果表明遗传算法(Genetic algorithm,GA)和粒子群优化(Particle swarm optimization,PSO)算法都能够有效地改进ANN,ANFIS和SVM模型在碳水通量评估中的模拟能力;在相同的碳或水通量的评估中,在不同的站点上,GA和PSO算法对ANN,ANFIS和SVM模型的改进效果的优劣存在差异,即没有一种优化算法一致地优于另一种算法。(4)根据小波分解技术对不同的机器学习方法在碳水评估上模拟性能的改进能力研究,研究结果表明小波分解技术都能够有效地改进ANN,SVM,GRNN,ELM,ANFIS模型在碳水通量评估中的能力,尤其是对净生态系统碳交换量(Net ecosystem exchange)通量,小波分解技术的改进效果更加地显著;小波分解方法中的小波基函数对这些机器学习模型的改进效果存在显著的差异,因此,使用小波分解来进行数据预处理时,其基函数的选择是相当关键的。