论文部分内容阅读
滑坡预测与预防是一个世界性的难题,近十几年来,随着人工智能的快速崛起,机器学习已被广泛应用于滑坡易发性预测。但是由于滑坡特征通常不相关或非线性相关,以及传统机器学习模型存在泛化能力弱、特征提取不充分等问题,导致基于机器学习的滑坡易发性预测模型存在一定的局限性。深度学习凭借其学习能力强、覆盖范围广、适应性好等特点已被广泛应用于智慧医疗、智慧城市、智慧交通、网络安全等诸多领域。本文提出了基于长短时记忆网络(Long ShortTerm Memory,LSTM)和双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)的两个滑坡易发性预测模型,将其应用于实采滑坡空间数据,并对滑坡环境因子和预测模型进行了可解释性分析。主要研究内容如下:(1)提出了一种基于级联并行长短时记忆和条件随机场的滑坡易发性预测模型cp LSTM-CRF(Cascade-parallel Long Short-Term Memory and Conditional Random Fields,cp LSTM-CRF)。首先,构建级联并行LSTM特征提取网络,使网络能够充分的提取滑坡环境因子间的非线性特征。其次,通过CRF对提取的特征进行优化,并对突变预测结果进行平滑处理,从而优化预测结果。将cp LSTM-CRF应用于江西省赣州市石城县滑坡易发性评价,并与逻辑回归(Logistic Regression,LR)、决策树(Decision Tree,DT)和多层感知机(MultiLayer Perceptron,MLP)进行对比。实验结果表明,cp LSTM-CRF的阴性预测率(Negative Predictive Rate,NPR)、滑坡预测准确率和预测率曲线下面积(Area Under Curve,AUC)分别为80%、75.67%和0.868,均优于C5.0DT(69.73%、75.67%、0.838)、LR(70.83%,70.94%,0.833)和MLP(71.64%、71.61%、0.826)。因此本文提出的cp LSTM-CRF预测模型有效地克服了传统机器学习的局限性,更充分地提取出非线性特征,提高滑坡易发性预测性能。(2)提出一种基于自筛选的双向长短时记忆和条件随机场的滑坡易发性预测模型SBi LSTM-CRF(Self-screening Bi-directional Long Short-Term Memory and Conditional Random Fields,SBi LSTM-CRF)。首先,利用Bi-LSTM和全连接构建预分类自筛选网络,设定阈值对因不确定因素导致标注结果错误的数据进行筛选。同时进行全研究区域预评估,以降低易发性评价过程中的不确定性。其次,根据筛除数量,从全研究区域预评估结果中筛选可靠数据进行等量补充。接着,构建级联Bi-LSTM特征提取网络,更充分的提取各方向的空间信息。最后,使用CRF获得栅格间平滑的滑坡概率输出。将SBi LSTM-CRF应用于陕西省延安市延长县滑坡易发性评价,并与cp LSTM-CRF和随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)、LR、随机梯度下降(Stochastic Gradient Descent,SGD)等机器学习模型进行对比。实验结果显示,SBi LSTMCRF的PPR,NPR,滑坡预测准确率和AUC分别为83.07%、82.56%、82.82%和0.9202,均优于cp LSTM-CRF(71.09%、76.03%、73.30%、0.7773)、RF(75.84%、78.04%、76.89%、0.8478)、SVM(71.82%、73.49%、72.62%、0.7800)、LR(70.43%、70.63%、70.53%、0.7682)、SGD(66.26%、73.95%、69.37%、0.7646)。因此,本文提出SBi LSTM-CRF有效地降低了滑坡易发性建模过程中的不确定性,有效地从正向栅格关联性、反向栅格关联性、邻近栅格能量三个方向深层提取特征,显著地提高了预测性能,具有更优的滑坡易发性评价性能。(3)滑坡易发性环境因子可解释性研究。针对机器学习算法可解释性弱的弊端,本文进一步以延长县研究为例,采用预测分布图和积分梯度深层次地解释了该研究区域的滑坡自然成因以及环境因子对神经网络的贡献。首先,利用预测分布图,研究经过SBi LSTM-CRF算法预测后的结果与环境单因子和环境双因子耦合之间的关系,阐述导致滑坡的可能的自然原理。然后,利用积分梯度计算各因子对SBi LSTM-CRF做出决策的贡献度总和。结果表明,坡度、高程、岩性、地表起伏度和坡向等滑坡因子控制了延长县地区的堆积层滑坡发育。在海拔为866.6 m~979.4 m,坡度为21.9°~41°,地形起伏度为33.1 m~84.6 m,岩性为t3y,地形湿度为0~0.123时,易引发滑坡发育。该研究为进一步阐述滑坡成因提供了依据。综上所述,本文基于长短时记忆深度神经网络提出了两种滑坡易发性预测模型cp LSTM-CRF和SBi LSTM-CRF,分别运用于江西省赣州市石城县和陕西省延安市延长县地质数据,获得了高性能的滑坡易发性预测结果。有效解决了滑坡环境因子高度非线性、传统机器学习存在局限性和滑坡易发性建模过程不确定等问题。并以延长县为例,对环境因子与滑坡的自然成因之间的关系进行了可解释性分析。总之,本文提出的两种预测模型以及可解释性分析方法对滑坡易发性预测研究有一定的创新性和通用性。