论文部分内容阅读
复杂时间序列预测问题普遍存在于智能交通、天气预报、食品安全、金融经济等复杂系统中,不仅与日常生活息息相关,还与社会发展和经济发展紧密联系。如果能够准确地把握时间序列的波动方向,则可以帮助管理者制定更好的决策,提高效率并减小损失。然而,由于实际获取的时间序列具有高度波动性与复杂性,在一定程度上加大了预测难度,准确预测含有复杂噪声的非线性时间序列仍是一个挑战。本文从非线性时序数据预测方法研究着手,结合门控循环单元(Gated Recurrent Unite,GRU)、卷积神经网络(Convolutional Neural Network,CNN)、经验模态分解(Empirical Mode Decomposition,EMD)和协方差交叉(Covariance Intersection,CI)融合等方法,基于复杂时序中不同模式的特征提取方式提高预测其未来发展趋势的准确性。本文的主要工作可以分为以下三个部分:(1)针对EMD分解分量个数的不确定性问题,本文提出了一种基于CNN网络的分量自适应组合分解方法——CEMD。该方法首先利用EMD算法将时间序列中含有不同统计特征的波动分量逐级分解出来,从而降低不确定因素对数据的影响,为后续处理提供更加有效的数据。之后,设计一维CNN网络对EMD分解获得的分量进行识别分类。最后,对具有相似波动规律特征的分量采用加和方式进行重构,从而得到固定数量的组合分量。经过重构后获取的组合分量更加适合于预测模型的构建,并且能够保证模型的泛化能力。(2)在组合分量模型的构建上,本文分析了目前广泛使用的循环神经网络中所存在的不足,在CEMD分解方法的基础上提出了预测单元——CEGRU,该方法采用GRU深度学习网络作为子预测模型对组合分量进行建模,能使模型具有更好的学习能力和预测精度。(3)针对实际可用含有复杂噪声的数据集规模,本文基于CEGRU构建了深度混合预测模型,分别提出了适用于小规模数据集预测的模型SCEGRU和适用于大规模数据集预测的模型LCEGRU。SCEGRU模型首先利用随机概率方法对时间序列的原始数据做数据增强处理并重组,然后使用所提出的CEGRU预测单元对重组序列进行建模。LCEGRU模型的训练随着时序数据在时间轴上不断更新,每更新一次数据保存一次模型。上述两个模型在训练过程中会产生多个分量模型,为此本文在预测阶段引入了CI算法对多个预测结果进行融合,进而得到原始时间序列的预测输出。本文研究的深度混合预测模型可有效解决含有复杂噪声的非线性非平稳时序数据预测问题,并且在多类型真实数据集上表现出了较好的预测能力。