论文部分内容阅读
时间序列分析作为人们认识客观世界和自然现象的重要手段,自二十世纪以来得到了迅速发展并被广泛的应用于现实生活领域。随着社会经济和生产生活的日新月异,与时间序列分析相关的重要技术之一,时间序列预测也相应地成为一个热门的研究领域,并在许多领域中发挥着重要的作用。时间序列预测是相关政策部门进行决策的基础,而相关政策部门的决策同时也是时间序列预测的延续。因此,准确的时间序列预测对人们做出正确的决策至关重要。随着计算机技术的发展与进步,涌现出许多人工智能和机器学习算法,大量学者也基于此开发了一系列基于机器学习算法的时间序列预测模型以致力于提高时间序列预测的效果和应用价值。相较于基于传统统计方法的时间序列预测模型而言,虽然这些预测模型能够在一定程度上改善时间序列预测的效果,然而在进一步研究中发现,基于机器学习算法的时间序列预测模型依据其建模策略的不同,在实际应用中仍然存在诸多难点问题,使得部分基于机器学习算法的预测模型仍然不能满足实际应用的精度要求,存在很多的问题亟待解决。首先,在基于信号分解算法的时间序列预测模型中,尽管现有的分解降噪方法能够减少时间序列随机性和非线性方面的影响。然而,对于具有较高复杂度的时间序列数据,简单的数据分解和降噪方法无法对具有不同特征的数据进行更加充分的分解和提取,无法降低时间序列中的干扰信息,阻碍了模型预测精度的进一步提升。如何更加科学合理的对时间序列进行分解,降低时序中的干扰信息是一项难点;同时,以往关于时间序列的预测模型的大量文献通常只聚焦于提升预测模型的精确性这一个方面的研究。然而,只关注模型精确性方面而缺乏对模型的稳定性方面进行研究是不够充分的,如何构造科学的多目标优化框架将准确性和稳定性这两项指标同时考虑在内是另一项研究难点;其次,若基于机器学习算法的预测模型中存在的参数过多,模型较为复杂度,则可能会导致模型无法得到泛化,出现过拟合现象。如何对模型进行科学有效的构建以避免过预测模型拟合现象的产生是一项研究难点;此外,针对组合预测模型中各单一预测模型的组合方式,采取何种措施对各单一预测模型所提取到的数据特征进行综合,并使综合后的各单一预测模型随时间的动态演变能够自适应地调节各个单一模型的占比也是研究中的难点;最后,针对传统确定性预测由于无法提供带有不确定因素的信息而使得其应用价值和范围受到一定程度的局限的问题,如何有效的构建不确定性预测进而对预测对象进行全面综合的分析是研究的难点。综合上述问题,本文从信号分解与降噪、模型构建及算法改进、组合预测模型权重系数优化、时间序列不确定性预测等几个不同方面进行了深入的探讨,并提出了一系列基于机器学习的时间序列组合预测模型和混合预测模型,通过引入更为先进有效的人工智能算法,分别从信号分解效率,网络结构优化,组合预测模型权重系数的筛选,混合预测模型各模块之间的协同促进方面进行创新与应用,对基于机器学习的时间序列组合预测模型和混合预测模型进行系统的分析与研究。主要研究结论如下:(1)针对时间序列预测存在的随机性较大,数据波动程度将强且波动范围较广而造成的预测精度不易提升等问题,本文将奇异谱分析(SSA)等信号分解技术应用在数据预处理模块中,并创新性的提出了一种基于完全自适应噪声集合经验模态分解—奇异谱分析(CEEMD-SSA)框架的双重信号分解策略和基于非线性误差分解修正(NEDC)策略的混合预测模型,用于对空气质量指数(AQI)时间序列进行建模。在该模型中,CEEMD-SSA策略能够通过将AQI时间序列分解为具有相似特征的子序列的方式来降低预测的复杂程度。另外,NEDC策略能够通过对误差信息进行提取的方式修正模型的预测结果。研究发现本文所提出的双重信号分解和误差修正策略能够帮助预测模型对复杂程度高的时间序列中隐含的不同信号特征进行更细致的划分,并能够通过对误差中的有效信息进行补充的方式进一步提升模型的预测精度。相较于以往的预测模型而言,基于CEEMD-SSA和NEDC策略的混合预测模型能够获得更高的预测精度。(2)针对以往时间序列预测模型在预测性能方面的关注点只集中在如何更有效的提升模型的预测精确度,而忽略了将预测模型的精确性和稳定性这两项指标同时考虑在内这一问题,本文提出了一系列涵盖了多目标蝙蝠算法(MOBA)、非支配多目标蝙蝠算法(NSMOBA)和非支配多目标蚁狮算法(NSMOALO)等多目标优化算法的组合预测模型和混合预测模型对不同领域的时间序列数据进行建模。并创新性的将偏差-方差(Bias-Var)目标框架应用于MOBA和NSMOBA的目标函数的构建。研究发现本文所提出的一系列基于多目标优化算法的预测模型能够同时作用于组合预测模型中的组合权重和混合预测模型中的参数优化模块,并结合帕累托最优理论组合成新型的多目标优化算法,自适应的对基于组合和混合这两类策略的预测模型进行不同程度的优化,使基于上述两种构成策略的预测模型能够同时收敛并同时获得到最优的预测准确度和稳定度的匹配。(3)针对以往单一预测模型结构过于复杂而可能会导致的模型过拟合问题,本文提出了多个基于自适应权重系数选择的组合预测模型和基于不同模块的混合预测模型。在这之中,本文还创新性的提出了基于添加惩罚项的分位数回归(QR)、分位数回归神经网络(QRNN)、分位数回归随机森林(QRF)和分位数支持向量机(QRSVM)框架的元学习策略对引入回归项的ARIMA模型(ARIMAX)、Elman神经网络(Elman)、递归分区回归树模型(RT)、SVM、bagging 回归(Bagging)、boosting 回归(Boosting)、随机森林(RF)、多元线性回归(MLR)、BPNN、QR、QRNN、QRF和QRSVM等13个基础模型进行动态重构和筛选,减少不必要的模型和相关参数,自适应的寻找到最优的混合预测模型的构成方式。最后,为了验证上述模型在确定性预测和概率预测方面的预测效果,选取了中国甘肃省玉门地区的两个风电场的15分钟时间间隔的风速、风向和风功率数据来对所构建的混合预测模型进行实证研究。研究发现本文所提出的混合预测模型能够通过自适应的调节各单一预测模型的权重占比来捕捉相对最有效的预测信息,因此这类模型具有更好的预测性能,能够获得相对更高的预测精度。(4)针对传统的确定性时间序列预测由于无法提供带有不确定因素的信息而使得不精确的预测结果在现实生产活动中可能导致的潜在风险这一问题,本文采用了在概率预测方面具有一定优势的基于QRF元学习器的混合预测模型来建立条件概率模型,对风功率时间序列中的不确定性因素进行提取,最终获得风电功率的确定性预测结果以及其在不同置信度水平下的概率预测结果。研究发现基于QRF元学习策略的混合预测模型在多数情况下可以获得相对较好的概率预测结果。在90%置信水平下,该模型产生的概率预测结果几乎能够覆盖所有的真实值,这一结果能够帮助风电场的管理部门制定和控制相应的生产计划,为风电场的安全运行提供技术保障,进而减少远期市场中由于风电预测的不确定性而产生的一系列不必要的竞价机会成本。