论文部分内容阅读
径流预测是水文研究的一个重要方向,指通过建立数学模型对河流的径流趋势进行研究及预测。预测结果可以广泛应用在防治洪水﹑干旱预防﹑环境改善﹑水库调度﹑水电站运行﹑航运管理﹑水资源分配与管理等领域中。但是,天气系统,流域下垫面以及人类活动等多种因素使水文系统的动态性加强,规模性和复杂性增大。这给预测研究带来极大挑战。径流预测的方法,可以分为两类:一是因果模型,根据水文过程的物理机制进行建模;二是数据驱动模型,不考虑径流形成的机制,通过挖掘数据内在的变化规律进行建模。因果模型具有较大的局限性,不仅需要对水文过程有详细的研究,在不同条件下必须采用特定的模型,而且对数据采集和研究人员的操作经验要求较高。在人工智能,机器学习技术的推动下,数据驱动模型成为近年来的研究热点,具有使用简便,预测精度好,适用性广等优点。本文采用数据驱动模型对黑河径流量进行预测,所建立的混合模型SARIMA-Random Forest-SVR能够达到良好的预测效果,拟合优度达到0.832。建模思路如下:首先采用时间序列分析的方法,建立SARIMA模型对月度径流数据进行预测。然后在残差处理的过程中,运用有监督学习的模式,以滞后期(滞后期从1到37)的残差值,滞后期残差值的滑动平均值和滑动标准差共41个变量作为候选输入变量,现期的残差值为输出变量建立支持向量回归模型。为了提高模型的效率和精度,采用随机森林算法(RandomForest)进行特征选择,对候选输入变量进行分析,从而筛选出重要性得分较高的20个因子作为模型最终的输入变量。之后,建立支持向量回归(Support Vector Regression)模型拟合残差序列,该过程中使用模拟退火智能算法(Simulated Annealing)进行参数寻优。最后将残差的预测值与时间序列模型的预测值进行整合,得到最终的预测结果。与单一模型及其他模型组合对比可以发现,本文建立的混合模型SARIMARandomForest-SVR能够充分利用各单一算法模型的优势,达到良好的预测效果。