论文部分内容阅读
本文首先较为全面地综述了国内外用各种模型方法来探讨植被和环境因子之间的关系的研究的现状以及最新的进展,之后又详细地介绍了人工神经网络(Artificial Neural Networks,ANN)技术、Arcgis引擎(Arcgis Engine,AE)技术、元胞自动机的基本原理(Cellular Automata,CA)、广义相加模型技术(Generalized Additive Models,GAM)和广义线性模型技术(GeneralizedLinear Models,GLM),并介绍了中国地质、地貌、气候、水文、土壤、植被等各方面概况,之后用四种模型方法(即人工神经网络技术结合元胞自动机(ANN+CA),人工神经网络(ANN),广义相加模型技术(GAM),广义线性模型技术(GLM))对中国12种森林植被类型进行建模,并用Kappa系数和AUC(即受试者工作特征曲线(ROC曲线)下的面积)来评价四种模型的模拟精度,进而选出精度最好的模型对12种森林植被类型在未来气候变化条件下的分布进行预测。
中国的森林植被类型共有两期,分别为1980年和2002年的中国12种森林植被的分布图。在建立模型时,把环境变量(即模型自变量)共分为43个,其中包括4个地形变量(即数字高程模型DEM,坡度slop,东西向的坡向aspectew,南北向的坡向aspectnw),5个距离变量(即到每个栅格到最近的公路的距离dis2road,到最近的河流的距离dis2river,到最近的铁路的距离dis2railway,到最近的湖泊的距离dis21ake,到最近的城镇的距离dis2town),1个土壤变量,8个气候变化变量(即1951-2004年的年平均气温tavg,夏季平均气温变化趋势t summer,冬季平均气温变化趋势t winter,冬季平均最低气温变化趋势t_min_winter,年平均气温变化趋势t_year,年平均降水量pavg,冬季平均降水量的变化趋势p_winter,夏季平均降水量的变化趋势p summer),13个森林植被类型变量(第一期的森林分布图以及分离开的值为0和1的12种森林的分布)和12个第一期森林植被类型的邻域信息变量,用这43个变量来反映每个栅格的环境状况;模型的因变量为1第二期的12种森林植被类型的分离变量。自变量和因变量均是以1000×1000m的分辨率被记录在4000×4887个栅格中。建模的思想主要是把4个地形变量、5个距离变量、1个土壤变量全都当作背景值,假设这些变量在进行森林植被模拟时是不变的,它们主要是在建模模拟时对森林植被类型的约束背景值,四个模型主要建立是的8个气候变化变量和两期森林植被类型变化之间的关系。
本文的得出的主要结论有:
1.四个模型的AUC值介于0.896和0.968之间,其中ANN+CA的模型的AUC最高,达到0.968,ANN模型的AUC次之,AUC值为0.942,GAM模型的AUC也在0.9以上,值为0.940,GLM模型的AUC值最低,小于0.9,值为0.896。四个模型的平均AUC值为0.942。从AUC来看,前三种方法的AUC值要明显地高于GLM的精度,ANN的AUC值要比ANN+CA低0.26,说明元胞自动机(CA)能够较大地提高模型的精度。
而Kappa值介于0.482和0.631之间,平均值为0.577。其中ANN+CA的模型的Kappa值最高,达到0.631,ANN模型的Kappa值次之,值为0.615,GAM模型的kappa值在0.6以下,值为0.581,而GLM模型的Kappa直最低,小于0.5,值为0.543。从Kappa值来看四种模型的精度,得出的结论与AUC一致,都是ANN+CA>ANN>GAM>GLM。可以看出,无论从AUC值还是从Kappa值来看,四个模型中ANN+CA(即人工神经网络结合元胞自动机模型)的精度最高,因此在用将来的气候变量来预测植被变化时,应该选择ANN+CA模型。
2.ANN+CA模型的构建
在构建ANN+CA模型时,本文结合BP神经网络技术,GIS(地理信息系统)和CA,在CA的邻居类型和如何客观正确地获取转化规则的定义和以及如何获取模型的输入和输出变量都进行了探索。结果表明,通过把12种森林植被类型的领域信息作为BPANN的输入变量的方法能够较为客观地获得CA的转换规则,从而使CA的应用更多简单;而基于Visual Studi02005平台下的C#语言和ArcGISEngine9.2的模型输入输出变量的提取功能模块则大大简化了栅格数据的处理以及数据库的建立。