论文部分内容阅读
三峡库区是我国滑坡的多发区和重灾区,尤其在库区蓄水运行后,库水位每年周期性波动,将有可能诱发古滑坡复活或产生新滑坡。若一旦发生滑坡,将会带来巨大的生命及财产损失,因此事先做出预测预报可有效减少灾害造成的损失。滑坡预报最重要的是预报方法与预报判据。若预报方法确定,没有正确的预报判据也无法进行准确的预报。
同时随着对滑坡的不断监测,其各类监测数据也呈直线上升,如何充分有效利用这些数据并提取有效信息也是当前需要解决的问题。数据挖掘方法的引入为其数据的分析提取滑坡预报判据提供了良好的手段。
基于上述目的,本文采用数据挖掘方法对滑坡预报判据进行挖掘。主要研究内容及结论如下:
(1)收集资料:收集三峡库区滑坡资料,包括各类监测资料,详勘调查资料等,并对收集到的资料进行分类详细整理和分析研究。结合目前滑坡预报判据适用性、滑坡地质条件等因素,选取白家包滑坡作为研究对象。
(2)滑坡监测数据预处理:了解目前滑坡监测的方法及监测指标,对白家包滑坡各项监测指标数据进行相差检验、数据一致性与同步性分析,将各类监测指标属性按照时间统一对应。最后经过数据预处理,使其成为符合数据挖掘的标准数据。
(3)滑坡变形阶段分析:先用传统的统计方法对滑坡明显变形阶段进行识别,然后运用数据挖掘中的k-means聚类算法对滑坡变形阶段进行聚类分析,首先分成3类、5类、7类划分尝试,试验后选取5类为最优并进行分类后类另恰并处理,最终形成3类分别与滑坡加速变形阶段、匀速变形阶段、缓慢蠕动阶段对应。并与传统统计方法对比说明k-meanas类具备可行性。
(4)属性分割:利用Apriori关联规则进行滑坡判据挖掘前,须先将各监测属性进行离散。经对比组距分组、分位数分组、均值-标准差分组、最优分组,最终选取最优分割法对各类属性进行离散。
(5)滑坡预报判挖掘:利用关联规则的Apriori算法进行多维关联规则挖掘与序列关联挖掘。挖掘内容包括滑坡变形阶段关联挖掘、滑体变形部位关联挖掘、地表与地下对应变形的关联挖掘、变形阶段的序列关联挖掘。挖掘过程分为选取训练样本生成关联规则模型、由模型生成对应规则集利用规则集对测试数据进行验证、进行多次训练并提取所需规则。