论文部分内容阅读
模式挖掘是数据挖掘的重要研究内容之一,人们在模式挖掘的过程中发现知识,完成数据挖掘的任务。模式是对客观事物的内外部机制直观而简洁的描述,它是理论的简化形式,可以向人们提供客观事物的整体内容。简单的说,模式就是从不断重复出现的事件中现和抽象出的规律。只要是一再重复出现的事物,就可能存在某种模式。模式挖掘,是对未知模式的探索,进行数据挖掘前,人们对可能发现的模式无法进行事先的预料。水文过程模式或径流过程模式,应表征水文物理过程的确定性因素影响的结果。因此,与其它类型的数据模式挖掘不同,水文径流过程的模式挖掘需要充分考虑水文过程的物理形成机制以及径流时间序列数据的特性。本研究针对径流数据的特点,对常规的模式挖掘方法进行了改进,提出适合径流过程的模式挖掘算法,具体步骤如下:①将每个自然月的日径流过程作为径流模式挖掘的候选集,径流模式挖掘在每组候选集内进行;②采用数据挖掘的相似性搜索算法,计算组内日径流过程样本的相似性距离,得到相似性距离矩阵;③采用层次聚类算法,对组内日径流过程样本进行模式聚类,得到每个自然月的日径流过程模式,每个模式内部具有相同的行为趋势。④用数学模型或水文模型对径流模式进行描述,利用模型参数分析每个径流模式所代表的水文物理意义。应用上述径流过程模式挖掘算法,对阿克苏河流域的沙里桂兰克站1 96 1-2002年4-9月的日径流序列(共42年)进行模式挖掘。每个自然月的日径流过程作为一组,4-9月共5个月,即5组,每组包含42个日径流过程样本,对组内样本两两计算其相似性距离,得到42×42的距离矩阵,然后利用距离矩阵对42个日径流序列进行聚类,设定聚类簇为10个,则该月份42年的日径流过程被分成10种类型的径流模式。阿克苏河流域沙里桂兰克站4-9月份的日径流序列由模式挖掘得到50种类型的径流模式,其中每个月份各有10种径流模式,各模式间差别较大,模式的形状、大小各不相同,不同模式反映了流域水文径流过程受融雪或降水的不同影响程度,以及洪水发生的时间、洪水过程的大小、洪峰的流量;而同一模式内的径流过程变化趋势一致,无论是流量的大小或是流量过程线的形态都具有较高的相似度。本研究进一步用气温降雨修正的AR(p)水文模型对得到的50种径流模式进行分析,定量分析不同径流模式对降雨和气温的不同响应程度。通过模型参数率定,发现有的径流模式对气温和降雨有共同的响应,少数模式对二者无响应。径流对气温响应的模式,说明此类径流模式受温度控制,径流补给主要以融雪补给为主;径流对降雨响应的模式,说明此类径流模式受降雨控制,径流补给主要以降雨补给为主;而对气温和降雨都响应的模式,则说明此类径流模式同时受到二者的共同作用,径流补给以融雪和降雨混合补给为其补给来源。各类径流序列模式,在气温参数和降雨参数中的取值大小,反映了对气温和降雨响应程度的大小,这也是通过数据挖掘能得到50种径流序列模式的专业知识解释,数据模式挖掘最终必须是人们可理解可解释的模式,才是有意义的模式。对径流模式所处的年代分析进一步发现,阿克苏河流域春季降雨径流比例增加,季节性融雪径流比例减少;夏季,80年代比六七十年代的降雨径流大幅度减少,90年代的降雨径流大幅度的增加,温度变化趋势则不明显;秋季径流受降雨影响程度经历先减小后增加的变化过程,受温度的影响亦如降雨,先减小后增大。从总体上看,90年代的径流过程的补给成分组成发生了较大的变化,且增加的径流主要为降雨径流,其次为融雪径流。