论文部分内容阅读
时间序列预测是一个被广泛讨论的问题,现今已有很多模型来解决各种各样的时间序列预测问题,它们主要分为线性模型和非线性模型。线性模型如ARMA、ARIMA、SARIMA模型能够根据获得的新数据进行实时调整,从而提高模型的预测精度,但是它们只能对数据的整体趋势进行分析和预测,对影响数据变化的各个因素并不能进行全面地分析;ARCH和GARCH模型不仅能预测条件方差值,还可获得预测值的迭代计算方法,并可据此迭代方法计算出风险预测值,但是为了保证非负性,通常假定模型中的所有系数均大于0,这种约束条件隐含着的任何滞后项的增大都会排除序列的随机波动行为,这可能导致在建模过程中出现震荡现象。非线性模型如神经网络,它们以快速的计算能力、对任意连续映射的逼近能力、学习能力及动态分析能力等优良特性,在回归预测中得到了广泛应用,但是它们容易陷入局部最小化和过拟合;支持向量机算法将实际问题通过非线性变换转换到高维的特征空间,在高维空间中构造线性判别函数来实现原空间中的非线性判别函数,这个特殊性质能保证其有较好的泛化能力,同时它巧妙地解决了维数问题,其算法复杂度与样本维数无关,但是这个模型对参数的选取非常敏感。考虑到上述各种预测模型的优缺点,Bate和Granger在1969年提出了组合预测思想,这个思想及其延伸为克服单一预测模型的各种缺陷带来了越来越多的选择。与目前被广泛使用的预测结果间的组合思想不同的是,本文紧紧围绕基于预测方法的组合思想来进行研究,这种思想对原始数据的性状各异的不同部分使用不同的方法来进行预测,从而充分发挥了各种方法的长处。基于后面这种组合预测思想,本文发展了两种组合方法来进行预测:1)对原始时间序列的趋势发展和随机波动分别用不同的合适模型进行预测,然后用它们的预测值组合成最终的预测结果;2)首先利用非线性信号处理技术对数据序列进行分解从而得到不同频率的子序列,然后得到高频和低频两条序列,再对它们用不同或相同的模型分别进行预测,而它们的预测值的组合即为最终的预测结果。另一方面,电力负荷和电价预测对社会效益最大化有着重大的现实意义,但是对它们的准确预测一直以来都是一个困难的问题,因此本文以这两项预测作为上述新的组合思想的应用背景。根据上述两种新的组合方法,本文建立了三个模型:1)根据第一种方法,考虑到电力负荷数据的多重季节性,先用季节累积式自回归动平均模型(SARIMA)模拟和预测时间序列,从而得到了拟合的残差序列(即随机波动量),由于这个残差序列的高度非线性性,本文引入非线性模型BP神经网络模型来预测它,最后将原始序列和残差序列的预测结果组合起来得到了最终的预测结果;2)根据第一种方法,考虑到电价数据的强波动性,首先使用处理方差聚集效应序列的主流算法广义自回归条件异方差模型(GARCH)来预测时间序列,然后用泛化能力卓著的支持向量回归机(SVM)来预测残差序列,最终得到组合的预测结果;3)根据第二种方法,首先利用经验模态分解法(EMD)对原始序列进行分解得到频率不同的子序列,然后将频率较高和较低的子序列分别加总为高频序列和低频序列,由于两条子序列所包含的波动因素远远少于原始序列,因此也就便于用预测模型来进行模拟,本文选用的是BP神经网络分别对它们进行预测,最后组合为最终的预测结果。此外本文针对每个模型还构造了衡量模型有效性的有效度准则,通过对澳大利亚的电力负荷和电价的预测,证明这些模型在提高预测准确度和有效度上是有效的。本文的主要研究成果及贡献如下所示:1)发展了组合预测的思想,引入了两种新的组合预测的方法,然后依此衍生出三个有效的预测模型,并且对每个模型构造了衡量模型有效性的有效度准则;2)电力负荷和电价预测是电力市场的热点问题也是难点问题,本文试图通过理论分析和实验比较找到准确度较高的预测模型,最终提高了预测准确度,是一次非常有意义的尝试。