论文部分内容阅读
近年来,数据挖掘己经引起了信息产业界的极大关注,这是快速增长的数据量和相对贫乏的信息量之间矛盾运动的必然结果,对数据挖掘技术进行系统、深入、全面、详尽地研究是全球信息化发展的客观需要,对于地震预报分析也起到一定的推动作用。 目前在地震预报中使用的数据处理方法仍然主要是一些常用统计方法,数据挖掘在地震预报中的应用还是初步的。由于地震数据的海量、非线性、高维性、缺值和干扰等特点,造成了使用目前正在使用的各种分析预报方法很难得出正确的结论,而数据挖掘的方法,正好能够很好的解决这些问题,使得数据挖掘在地震预报领域有着广泛的应用前景。 本文旨在把数据挖掘的理论和技术与地震预报的研究方法结合起来,研究适合于地震数据特点的数据预处理和数据挖掘算法。把数据挖掘技术中关联规则和时间序列方法引入到地震预报领域,目的是运用关联规则和时间序列寻找隐藏在大量地震数据背后的规律,发现潜在的、有价值的地震预报知识。 本文的重点是对地震数据进行了数据预处理工作。地震目录数据是由地震时间、经度、纬度、震级组成的数据,如果直接对其进行关联规则挖掘,挖掘出来的结果是一些点与点之间的关联,是没有意义的。本文针对地震数据的特点,对地震数据进行了数据预处理工作。预处理过程包括:地震数据格式的转换、噪声处理、规范化处理、数据归约和数据离散化。 为了适应数据挖掘技术的要求,本文结合地理区域对地震目录数据进行预处理,包括对空间跨度、震级进行预处理。 空间跨度预处理首先将全球表面依据经纬度范围进行分块划分,对块编号并生成块与经纬度对应表;其次扫描地震目录信息表M,对其每一条地震记录Record,依照其经纬度将震例划入相应的块A中,设置记录Record的块标示为块A的ID,并对震级进行离散化处理;最后使块A中地震的次数累加。