基于地质灾害数据仓库的空间数据挖掘应用研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:py13141314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国是一个地质灾害频发的国家,每年地质灾害给国民经济和人们生活带来的创伤是难以计数的。地质灾难不仅给民众的生活安定带来了严重的影响,更严重的牵涉到国家的重大经济决策。滑坡等地质灾害的预防和减轻的重要性和紧迫性由此可见一斑。因此,滑坡形变预测研究成为了一个热门课题。白2003年以来,地质灾害监测预警系统在三峡库区逐步展开,各区各县已建立了灾害监测点。针对易发的滑坡体进行逐月监测,积累了海量的滑坡变形、坝前长江水位、库区白然降雨量、滑坡体地下水位等数据。滑坡监测数据是一切研究活动的基础,但是目前这些数据的利用率低,而且也没有有效的方法使用和挖掘数据间的隐含规律。如何有效的利用数年来积累的海量监测数据成为当前亟需解决的问题。滑坡体由于受到太多因素的影响,而且其中还不乏一些不确定的因素,因此滑坡形变位移预测注定是一个极为复杂的问题。同时,各诱发因素同坡体形变之间儿乎都不是呈现线性的规律,所以它义是一个高度非线性的问题。在大多数情况下,难以用明确的数学模型来描述这一过程。数据挖掘技术不囿于解决线性或者非线性问题,其主要是能有效地发掘数据中隐藏的规律和模式,因此将此技术用于滑坡位移预测将是行之有效的。基于以上问题,笔者以三峡库区秭归县八字门滑坡和树坪滑坡的形变位移、归州和沙镇溪地区的自然降雨、三峡大坝坝前水位变化等监测数据为基础,拟提出适合分析影响滑坡形变的理论模型。在整理消化数据的基础上,结合监测月报反映的实际情况,观察各监测点位移随诱发因素变化的历时曲线,运用多种分析方法,从定性和定量分析滑坡位移变化与诱发因素的相关性及滞后性。实验所用数据为三峡地区秭归县境内的滑坡监测数据。实验数据源来源复杂,包括各滑坡位移GPs监测数据、归州和沙镇溪地区自然降雨量记录、长江三峡坝前水位记录、各滑坡钻孔测斜记录、滑坡体岩土推力监测记录等。各项数据的监测时间间隔都不一致,日期也不相同,记录表没有统一的规范,而且兼有人工手动测量和仪器自动测量。在进行数据处理之前,以滑坡位移预测为目的,对现有的气象、水文以及海量滑坡监测数据,进行了数据核查和整理,并且根据后续实验要求对原始数据进行合理的重新采样。这是保障后续数据挖掘实验顺利开展的必要前提。然后,对滑坡形变产生影响的因素,以及这些因素的影响力进行必要的定性分析,包括对原始数据的可行性分析、图表分析等。进一步消化理解原始数据。在能够合理解释原始数据的基础上,提出新的有利于数据挖掘的变量。在整理原始数据,理解原始数据,定性分析影响因素对滑坡形变作用的基础上,通过计算双变量间的Pearson系数,对各因素同滑坡形变位移间的关系形成初步的定量认识。然后再通过Apriori关联规则分析,初步找出水位、降雨量同滑坡位移间的量化关系。最后,结合定性分析的结果,利用多元回归分析和ARIMA方法结合BP神经网络两种方法建立综合预报指数与滑坡累积位移量关系的预报模型,从定量的角度对滑坡形变进行分析。通过上述研究,取得了以下成果:(1)本文在整理原始数据,理解原始数据,定性分析影响因素对滑坡形变作用的基础上,通过计算双变量间的Pearson系数,对各因素同滑坡形变位移间的关系形成初步的定量认识。然后,通过Apriori关联规则分析,找出了坝前水位、水位涨落速度以及自然降雨量同滑坡形变位移间的关系。(2)本文利用多元回归分析和1ARIMA方法结合BP神经网络两种方法分析综合诱因对滑坡累积位移量的影响作用。多元回归模型对八字门和树坪两个滑坡体的位移拟合曲线在蓄水期的拟合情况较好,比较接近实际的位移变化趋势。而神经网络的拟合结果正好与其互补。神经网络对汛期的位移变化情况拟合的比较好。(3)本文将BP网络引入趋势项和时序误差项,对滑坡形变量进行预测,得出对汛期滑坡位移形变速率预测值,误差落在10%以内。(4)本文根据时间序列数据的特点,从滑坡月形变速率中抽取出趋势项和周期项。并对水位、降雨量及滑坡位移分别建立了各自合适的ARIMA模型。本文的创新之处在于,提出了一系列对滑坡监测数据的挖掘方法,尽量提高历史监测数据的利用率。在实验基础上,得到一些以前没有的对于滑坡规律的新认识。
其他文献
随着互联网技术和视频技术的发展,网络视频的数量呈现出爆炸式的增长速度。台标作为网络视频的一个最显著标志之一,对于视频检索、视频监管均具有重要的应用价值,同时视频台标检
随着通信技术的快速发展,视频的传输和扩散越来越便捷。随之而来的版权保护问题也得到了越来越多的关注。视频水印就是常见的.有效的版权保护方法。为了能够有效的保护版权,
计算机内存系统是影响体系结构、系统软件和应用软件效能的最重要因素之一。过去几十年,由于处理器与内存之间的性能差距越来越大,内存系统已成为制约系统性能的瓶颈。近几年,高
学位
随着web和社交网络的兴起,图计算相关的应用已经成为计算机领域的一个热点。为图计算提供数据存储服务和查询服务的图数据存储系统,在面对社交网络这种大规模数据集时,也正遭遇
随着网络的持续发展,数据量以惊人的速度增长,冗余信息大量存在,同时数据间存在着复杂的关联关系。这使得现有的排序方法中面临着三个问题:信息冗余影响排序结果、将异质关联关
学位
深度学习是机器学习领域中比较新兴的方向,很多研究者相信通过对它的研究,可以达到机器学习的一个本质目的——人工智能。本文主要研究了如何将深度学习应用于行人重现检测技术
高性能计算对科学技术的进步、经济社会的发展起着不可估量的作用,除对性能的追求以外,高能效在高性能计算领域也受到越来越多的重视。面向应用的定制计算是提高计算效能的有效
随着普适计算和物联网的发展,衍生出一类基于位置服务的应用。目前基于位置服务已得到了迅猛的发展,并广泛应用于场馆定位导航、移动互联网应用、资产管理、人员定位、物流管理