论文部分内容阅读
森林火灾是一种破坏性极强的自然灾害,它不仅对生态系统造成不可逆的破坏,同时威胁着国家和人民的生命财产安全。我国是一个林火多发的国家,黑龙江省作为我国重要的林业大省,也是森林火灾的高发区,做好该地区的森林防火工作具有重要意义。本文基于ArcGIS10.2、SPSS19.0以及R软件,应用逻辑斯蒂回归模型和随机森林算法,用逻辑斯蒂模型识别显著变量,用随机森林算法对变量相对重要性进行排序,分别分析了黑龙江省林火发生与气象类因子、非气象类因子和综合因子之间的关系并建立预测模型,基于林火发生预测概率对黑龙江省进行森林火险等级区划,研究结果为当地森林火灾的预测预报工作提供了科学依据和理论参考。研究结果表明,气象类因子是影响黑龙江省林火发生的重要因子。对气象类因子进行回归分析得到的结果显示:逻辑斯蒂回归模型识别的显著气象因子包括“日最高地表气温”、“日最低地表气温”、.“24小时累计降水量”、“日平均本站气压”、“日最低本站气压”、“日照时数”、“日最高气温”、“日平均相对湿度”共8个变量。随机森林算法识别的重要气象因子包括“日最高地表气温”、“日最低地表气温”、“日平均本站气压”、“日最高本站气压”、“日最低本站气压”、“日平均相对湿度”、“日照时数”和“日最高气温”共8个变量。随机森林变量重要性排序结果显示,“日平均相对湿度”是最重要的驱动因子,“日最低地表气温”和“日最高气温”的影响次之,影响最小的变量是“日最低本站气压”。与气象因子相比,非气象因子对黑龙江省林火发生的影响较小。对非气象类因子进行回归分析得到的结果显示:逻辑斯蒂回归模型识别的显著非气象因子包括“植被覆盖度”、“坡度”、“距离居民点距离”、“距离铁路距离”、“距离公路距离”、“人均GDP”、“人口密度”共7个变量。随机森林算法识别的重要非气象因子包括“高程”、“距离铁路距离”、“距离居民点距离”、“距离公路距离”、“植被覆盖度”、“人均GDP”、“人口密度”和“坡度”共8个变量。随机森林变量重要性排序结果显示,“植被覆盖度”是最重要的驱动因子,“高程”和“人均GDP”的影响次之,影响最小的变量是“坡度”。对综合因子进行回归分析得到的结果显示:逻辑斯蒂回归模型中的15个驱动因子均在a=0.05水平上显著,其中“植被覆盖度”、“坡度”、“距离铁路距离”、“距离公路距离”、“人均GDP”、“人口密度”、“日最高地表气温”、“日平均本站气压”、“日照时数”、“日最高气温”与林火发生呈正相关,“距离居民点距离”、“日最低地表气温”、“24小时累计降水量”、“日最低本站气压”、“日平均相对湿度”与林火发生呈负相关。随机森林算法拟合的16个驱动因子中,“日平均相对湿度”的重要性排在第一位,紧随其后的是“高程”、“植被覆盖度”和“日最高气温”,重要性最低的是“坡度”。同时,气象类因子和非气象类因子的重要性是相间分布的。通过受试者工作特征曲线、AUC值和模型的预测正确率对两种模型进行评价,在气象类因子分析中,RF的AUC值(0.963~0.966)高于LR的AUC值(0.837~0.839),RF的预测正确率(90.9%~92%)高于LR的预测正确率(75.5%~75.9%);在非气象类因子分析中,RF的AUC值(0.871~0.876)高于LR的AUC值(0.685~0.688),RF的预测正确率(78.4%~79%)高于LR的预测正确率(62.9%~64.5%);在综合因子分析中,RF的AUC值(0.969~0.973)高于LR的AUC值(0.853~0.855),RF的预测正确率(90.4%~91.2%)高于LR的预测正确率(76.7%~77.3%)。综合来看,除LR非气象因子分析的AUC值外,其他模型的AUC值均高于0.8。说明逻辑斯蒂模型不能独立解释非气象类因子与黑龙江省林火发生之间的关系,除此之外的其余模型的拟合效果较好,但相比之下随机森林算法的拟合效果和预测精度要更优于逻辑斯蒂模型,更适合黑龙江省林火的预测。林火预测概率图和火险区划图显示:黑龙江省高火险区面积占全省总面积的19%,主要分布在大兴安岭、佳木斯、双鸭山以及黑河大部分地区,防火策略和管理计划应以火险区为基础,加强高火险区的林火管理工作,同时兼顾林区内其他中、低火险地区。