论文部分内容阅读
水文时间序列关联规则的挖掘是水文时间序列数据挖掘的一个分支,也是水文领域研究的难点。此问题的解决对区域水文的周期性分析、水文预报等有着重要的意义。由于水文数据量大、水文要素繁多,通过在水文领域中引入数据挖掘的理论与技术,为解决水文科学研究面临的问题提供了新思路。
本文在充分理解数据挖掘基本理论的基础上,将数据挖掘技术应用到水文时间序列。以国家水利部“948”项目为背景,以数据挖掘中关联规则挖掘一般过程为基础构建了水文时间序列关联规则挖掘的模型,对水文时间序列关联规则挖掘过程中的关键问题做出论述。
本文选择太湖流域西苕溪港口站点作为研究区域,通过SAS数据挖掘工具研究关联规则挖掘技术在水文领域的应用,为水情预报和水文分析提供信息支撑。首先,通过改进的基于聚类和最小方差的离散化方法对水文数据中的连续型数值进行了离散化处理,并且结合时间特征把水文数据进行了区间的划分,生成具有统一格式的SAS数据集。其次,采用统计分析的方法实现规则优化,并对数据集中的属性和相应的属性值进行了筛选,生成最佳组合,剔除冗余的属性和属性值。最后,根据经典的关联规则生成算法生成水文时间序列的关联规则,结合最佳组合和新的兴趣度的定义产生普通的关联规则和有趣的关联规则,并对结果进行分析和对比。实验结果证明,在水文时间序列分析中,按照数据挖掘的方法,采用时间序列关联规则的挖掘模型,结合聚类分析、最小方差方法和统计分析,进行水文时间序列关联规则的挖掘可以有效的改进原始方法的效率,挖掘出有用的规律和模式,为水文和水情分析提供可靠信息。