论文部分内容阅读
随着大数据时代的到来,各行各业产生了海量的数据集。大规模的时间序列数据集作为重要而复杂的数据对象,给各行各业带来了机遇和挑战。一方面,丰富的数据挖掘和分析技术降低了数据生成和收集的成本,丰富了数据源;另一方面,时间序列数据的规模变大也给预测带来了巨大的挑战。因此,寻求高性能的方法来处理大规模的时间序列数据一直是学术界和工业界的研究热点。一般来说,提升预测方法准确性和鲁棒性的方法主要有两种:提出新的预测模型、对现有的预测方法进行集成。其中,最常使用的方法是提出集成模型,它旨在将单个模型的优势应用到大规模时间序列预测的建模和识别中,尽可能地提高模型的预测性能。本文的主要工作是基于现有的经典算法提出了四个用于多步向前时间序列预测的集成模型。提出的第一个集成模型是NCFM模型,它将回声状态网络(ESN)作为组合函数,集成了四种混合算法SSA-QPSO-ESN、SSA-NARX、SSA-CBP和SSA-QPSO-LSSVM。另外在该方法中,奇异谱分析(SSA)用于对时间序列数据进行预处理,量子行为粒子群优化算法(QPSO)用于优化ESN的参数。通过对风速时间序列数据进行模拟和仿真,并将NCFM模型的预测结果与其他七种方法的预测结果进行了对比和分析,验证了NCFM模型的准确性和有效性。提出的第二个集成模型是MOPSO-Combined模型,它首先使用多目标粒子群优化算法(MOPSO)优化ESN的参数来提高集成模型的预测精度和稳定性。然后,使用MOPSO-ESN算法组合三个混合算法(SA-GRNN、SA-Elman和SA-CBP)。此外,使用滑动窗口将时间序列数据划分成多步向前预测的样本。为了验证MOPSO-Combined模型的预测性能,在风速时间序列数据上进行了三组实验。实验结果表明,该模型在预测精度和稳定性方面优于其他十种对比模型。提出的第三个集成模型是基于多元时间序列数据的CE-SOM-MOGRELM模型。为了使数据预处理中的降噪过程更加合理,该算法结合补充总体经验模态分解(CEEMD)和自相关系数(ACF)提出了CEACF机制。集成模型还将聚类的概念引入到了时间序列预测中,使用自组织竞争神经网络(SOM)对样本空间进行聚类得到多个样本簇。然后,使用正则极限学习机(RELM)对每个样本簇进行建模和识别,在此过程中,使用多目标灰狼优化算法(MOGWO)优化RELM的参数。为了验证模型的预测性能,在风速相关的多元时间序列上进行了四组实验,实验结果表明,该模型在预测精度和稳定性方面均优于对比模型。提出的第四个集成模型是基于深度学习的DLR-MogR模型。深度学习应用于时序预测已成为一种趋势。MOGWO优化的RELM算法(MogR)作为组合函数组合了三种深度学习算法:深度信念网络(DBN)、深度双向循环神经网络(DBiRNN)和深度长短期记忆网络(DLSTM)。另外,集成模型还使用网格搜索优化三个深度网络的结构,使用dropout机制防止过拟合。最后,在风速时间序列数据上的实验结果表明,DLR-MogR模型比其他七种对比模型拥有更高的精度和更稳定的性能。最后,为了更加全面地量化和对比四个集成模型的预测效果。本文使用了四组不同类型的时间序列数据,统计四个模型在每组时间序列数据上的实验结果并进行对比和分析。本研究的主要成果和贡献如下所示:(1)提出了四种用于时间序列多步向前预测的集成算法。(2)使用ESN方法作为组合函数,并利用QPSO和MOPSO两种算法优化ESN的参数。(3)使用RELM方法作为组合函数,并利用MOGWO算法优化RELM的参数。(4)在集成模型中引入了多元时间序列和样本聚类的概念。(5)提出CEACF机制用于时间序列预处理,使降噪操作更加合理。(6)组合了三种深度学习算法,并使用dropout机制防止过拟合。