论文部分内容阅读
时间序列能够反映工业、经济、气象、交通、能源等各个领域中的不同现象和过程,客观地记录这些现象和过程的演变规律。如果能够很好地掌握和运用这些规律,就可以规避风险、优化配置和节约能源,因此时间序列的分析与研究具有十分重大的现实意义。预测是一种时间序列的分析方式,能够依据有限的历史数据资料,运用数理统计、随机过程理论和机器学习方法研究数据中潜在的依存关系,进而刻画和了解待分析对象的演变规律,并对其未来的发展趋势作出估计和判断。传统的统计预测模型擅长于刻画数据依存关系中的线性关系,但在面对现实世界中高度复杂的系统所表现出来的非线性特征时,该类方法的预测精度就会明显降低。随着现代人工神经网络理论的进一步发展,这种模拟人脑思维方式的数学抽象模型在特征学习、数据压缩、模式识别、时间序列预测等领域均获得了较大的成功。神经网络多是以一定数量的人工神经元构成的隐含层或具有隐含层表达能力的结构,如储备池等来抽象和学习数据间的依存关系。相比较传统的统计预测模型,这种灵活的结构更能捕获现实世界中复杂的数据关系,尤其是非线性数据关系。为了克服现有预测模型在自适应学习、数据特征的分离提取和高层抽象学习等方面的不足,本文依托于神经网络强大的函数逼近能力,采用诸如数据预处理、元启发式优化算法、多储备池计算等手段,并结合统计模型的固有优势,提出了四个新的基于神经网络的预测模型:(1)基于BPNN(Back Propagation Neural Network)的数据驱动组合预测模型。针对传统统计模型无法精确刻画现实系统复杂的非线性特征的问题,提出了一种数据驱动的神经网络预测模型。该模型首先利用集成经验模态分解技术EEMD(Ensemble Empirical Mode Decomposition)将原始时序数据分解为多个具有不同震荡模式的本征模态函数IMFs(Intrinsic Mode Functions)和残差(Residual),消除序列中的噪声成分,获取能够反映原始数据特征的近似序列。然后,在这个近似序列上利用优化的后向传播神经网络学习数据间的依存关系,优化机制则采用一个改进的花朵授粉算法CSFPA(Chaotic Self-adaptive Flower Pollination Algorithm)来实现。(2)基于ARIMA–ESN(Autoregressive Integrated Moving Average–Echo State Network)的线性–非线性组合预测模型。针对传统带权的线性—非线性组合模型在捕获数据特征时,只是在原始数据空间中利用权重来表达各个基本方法的贡献,不能充分发挥这些方法的优势这一问题,提出了一种基于分治策略的组合预测模型。该模型首先在原始数据空间中提取具有局部线性特征和非线性特征的子序列,然后利用线性的ARIMA和非线性的ESN分别捕获这两个子序列的数据模式。由于数据的非线性特征会极大地影响预测精度,因此采用一个新式的WOA(Whale Optimization Algorithm)算法帮助ESN提高储备池的学习能力。(3)基于储备池结构优化的ESN预测模型。针对储备池结构在本质上可以动态地反映网络的非线性学习能力,不合适的输入响应会对预测结果产生消极的影响这一问题,提出了一个改进的二进制共生生物搜索算法(Binary Symbiotic Organisms Search,BSOS)和基于此算法的ESN预测模型。所提的二进制搜索算法BSOS利用一个v-型的传递函数实现表达神经元连接的二进制变量是否需要翻转的功能,由此来决定储备池内部的神经元连接状态。在该算法的作用下,ESN对于输入信号的学习能力能够实现最大化。(4)基于深度储备池结构的ESN预测模型。针对现有深度结构的ESN在学习过程中面临的多储备池采样规模较大的问题,提出了一种改进的深度ESN预测模型。该模型只需顶层的储备池参与状态采样,由此可以缩小储备池状态矩阵的规模并简化网络输出权重的计算。所提的深度ESN由泄漏积分型神经元(Leaky Integrator Neuron)构建而成,在多个与环境相关的数据集上均表现出了较好的预测能力,并且能够使得网络的输出权重不会出现过大的情况。