论文部分内容阅读
水文时间序列数据挖掘是数据挖掘技术在水文领域的应用,它根据水文领域的数据特点和信息需求,选用高效的数据挖掘算法,从大量的水文数据中提取有用的信息和知识,为解决水文领域的突出问题提供新的分析方法和科学的决策支持。目前水文时间序列数据挖掘算法研究与应用还处于起步阶段,本文在对数据挖掘技术和水文时间序列数据特点深入分析的基础上,重点研究了应用数据挖掘技术进行水文时间序列模式描述、相似性度量、分类与预测等算法,并通过实测水文资料进行验证和评测。论文主要研究内容与成果如下:1.以水文时间序列局部极值点和形态特征为切入点,提出了一种基于要素特征的水文时间序列模式描述方法。解决了由于短期波动频繁、局部极值点多、数据点对应时刻不均匀等原因造成的分段描述算法不适用的难题。实验表明,这一方法简单、高效,适用性强。2.提出了一种改进动态时间扭曲距离公式——自适应分段动态时间扭曲(ASDTW)距离公式,从而构成了基于要素特征的水文时间序列相似性度量的完整算法,实验表明,该方法无论是对模式趋势的总体把握情况,还是与原始时间序列的拟合误差情况,均具有独特的优势,比较适合水文时间序列的数据特点。3.探索了利用数据挖掘算法进行水文时间序列分类问题。根据水文时间序列数据的特点,对模型树和基于实例学习算法进行改进。将支持向量回归与模型树等算法相融合,应用于等时隔的水文过程数据挖掘;从样本集提取、干扰样本处理和属性加权三个方向,对传统的基于实例学习算法进行改进,并与自适应分段动态时间扭曲(ASDTW)距离公式相结合,建立了不等时隔的水文要素摘录系列数据挖掘模型。4.选择一水文站流域作为实验区域,将基于支持向量回归的模型树算法进行了具体应用,建立了数据挖掘预测模型,并与新安江模型进行了对比分析,它具有输入数据少、过程简单、维护工作量小等优点,且精度能够得到保证。5.针对水文数据库水文要素摘录系列,利用改进实例学习算法,从数据准备开始、经数据预处理、初始实例集、样本集选取、属性权重赋值、相似属性度量,最终建立起水文要素摘录系列数据挖掘模型,通过与传统的降雨径流经验相关法进行比较分析,水文要素摘录系列数据挖掘模型具有操作简单、计算快、维护简单、成果可靠的优点,具有实用价值。本文主要创新点:在动态扭曲(DTW)距离基础上,适应水文时间序列数据特点,提出了自适应分段动态时间扭曲(ASDTW)距离公式,并与改进的基于实例学习算法相结合,解决了水文要素摘录系列数据挖掘问题;首次将支持向量回归与模型树等算法相融合应用于逐日径流预报,丰富了水文时间序列数据挖掘技术手段。