基于机器学习算法的时间序列组合及混合预测模型的研究与应用

来源 :东北财经大学 | 被引量 : 0次 | 上传用户：hy1330

【摘要】

：

【作者】

：

衡佳妮

【机构】

：

东北财经大学

【出处】

：

东北财经大学

【发表日期】

：

2020年01期

【关键词】

：

时间序列预测机器学习组合预测策略混合预测策略

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

时间序列分析作为人们认识客观世界和自然现象的重要手段,自二十世纪以来得到了迅速发展并被广泛的应用于现实生活领域。随着社会经济和生产生活的日新月异,与时间序列分析相关的重要技术之一,时间序列预测也相应地成为一个热门的研究领域,并在许多领域中发挥着重要的作用。时间序列预测是相关政策部门进行决策的基础,而相关政策部门的决策同时也是时间序列预测的延续。因此,准确的时间序列预测对人们做出正确的决策至关重要。随着计算机技术的发展与进步,涌现出许多人工智能和机器学习算法,大量学者也基于此开发了一系列基于机器学习算法的时间序列预测模型以致力于提高时间序列预测的效果和应用价值。相较于基于传统统计方法的时间序列预测模型而言,虽然这些预测模型能够在一定程度上改善时间序列预测的效果,然而在进一步研究中发现,基于机器学习算法的时间序列预测模型依据其建模策略的不同,在实际应用中仍然存在诸多难点问题,使得部分基于机器学习算法的预测模型仍然不能满足实际应用的精度要求,存在很多的问题亟待解决。首先,在基于信号分解算法的时间序列预测模型中,尽管现有的分解降噪方法能够减少时间序列随机性和非线性方面的影响。然而,对于具有较高复杂度的时间序列数据,简单的数据分解和降噪方法无法对具有不同特征的数据进行更加充分的分解和提取,无法降低时间序列中的干扰信息,阻碍了模型预测精度的进一步提升。如何更加科学合理的对时间序列进行分解,降低时序中的干扰信息是一项难点;同时,以往关于时间序列的预测模型的大量文献通常只聚焦于提升预测模型的精确性这一个方面的研究。然而,只关注模型精确性方面而缺乏对模型的稳定性方面进行研究是不够充分的,如何构造科学的多目标优化框架将准确性和稳定性这两项指标同时考虑在内是另一项研究难点;其次,若基于机器学习算法的预测模型中存在的参数过多,模型较为复杂度,则可能会导致模型无法得到泛化,出现过拟合现象。如何对模型进行科学有效的构建以避免过预测模型拟合现象的产生是一项研究难点;此外,针对组合预测模型中各单一预测模型的组合方式,采取何种措施对各单一预测模型所提取到的数据特征进行综合,并使综合后的各单一预测模型随时间的动态演变能够自适应地调节各个单一模型的占比也是研究中的难点;最后,针对传统确定性预测由于无法提供带有不确定因素的信息而使得其应用价值和范围受到一定程度的局限的问题,如何有效的构建不确定性预测进而对预测对象进行全面综合的分析是研究的难点。综合上述问题,本文从信号分解与降噪、模型构建及算法改进、组合预测模型权重系数优化、时间序列不确定性预测等几个不同方面进行了深入的探讨,并提出了一系列基于机器学习的时间序列组合预测模型和混合预测模型,通过引入更为先进有效的人工智能算法,分别从信号分解效率,网络结构优化,组合预测模型权重系数的筛选,混合预测模型各模块之间的协同促进方面进行创新与应用,对基于机器学习的时间序列组合预测模型和混合预测模型进行系统的分析与研究。主要研究结论如下:（1）针对时间序列预测存在的随机性较大,数据波动程度将强且波动范围较广而造成的预测精度不易提升等问题,本文将奇异谱分析（SSA）等信号分解技术应用在数据预处理模块中,并创新性的提出了一种基于完全自适应噪声集合经验模态分解—奇异谱分析（CEEMD-SSA）框架的双重信号分解策略和基于非线性误差分解修正（NEDC）策略的混合预测模型,用于对空气质量指数（AQI）时间序列进行建模。在该模型中,CEEMD-SSA策略能够通过将AQI时间序列分解为具有相似特征的子序列的方式来降低预测的复杂程度。另外,NEDC策略能够通过对误差信息进行提取的方式修正模型的预测结果。研究发现本文所提出的双重信号分解和误差修正策略能够帮助预测模型对复杂程度高的时间序列中隐含的不同信号特征进行更细致的划分,并能够通过对误差中的有效信息进行补充的方式进一步提升模型的预测精度。相较于以往的预测模型而言,基于CEEMD-SSA和NEDC策略的混合预测模型能够获得更高的预测精度。（2）针对以往时间序列预测模型在预测性能方面的关注点只集中在如何更有效的提升模型的预测精确度,而忽略了将预测模型的精确性和稳定性这两项指标同时考虑在内这一问题,本文提出了一系列涵盖了多目标蝙蝠算法（MOBA）、非支配多目标蝙蝠算法（NSMOBA）和非支配多目标蚁狮算法（NSMOALO）等多目标优化算法的组合预测模型和混合预测模型对不同领域的时间序列数据进行建模。并创新性的将偏差-方差（Bias-Var）目标框架应用于MOBA和NSMOBA的目标函数的构建。研究发现本文所提出的一系列基于多目标优化算法的预测模型能够同时作用于组合预测模型中的组合权重和混合预测模型中的参数优化模块,并结合帕累托最优理论组合成新型的多目标优化算法,自适应的对基于组合和混合这两类策略的预测模型进行不同程度的优化,使基于上述两种构成策略的预测模型能够同时收敛并同时获得到最优的预测准确度和稳定度的匹配。（3）针对以往单一预测模型结构过于复杂而可能会导致的模型过拟合问题,本文提出了多个基于自适应权重系数选择的组合预测模型和基于不同模块的混合预测模型。在这之中,本文还创新性的提出了基于添加惩罚项的分位数回归（QR）、分位数回归神经网络（QRNN）、分位数回归随机森林（QRF）和分位数支持向量机（QRSVM）框架的元学习策略对引入回归项的ARIMA模型（ARIMAX）、Elman神经网络（Elman）、递归分区回归树模型（RT）、SVM、bagging 回归（Bagging）、boosting 回归（Boosting）、随机森林（RF）、多元线性回归（MLR）、BPNN、QR、QRNN、QRF和QRSVM等13个基础模型进行动态重构和筛选,减少不必要的模型和相关参数,自适应的寻找到最优的混合预测模型的构成方式。最后,为了验证上述模型在确定性预测和概率预测方面的预测效果,选取了中国甘肃省玉门地区的两个风电场的15分钟时间间隔的风速、风向和风功率数据来对所构建的混合预测模型进行实证研究。研究发现本文所提出的混合预测模型能够通过自适应的调节各单一预测模型的权重占比来捕捉相对最有效的预测信息,因此这类模型具有更好的预测性能,能够获得相对更高的预测精度。（4）针对传统的确定性时间序列预测由于无法提供带有不确定因素的信息而使得不精确的预测结果在现实生产活动中可能导致的潜在风险这一问题,本文采用了在概率预测方面具有一定优势的基于QRF元学习器的混合预测模型来建立条件概率模型,对风功率时间序列中的不确定性因素进行提取,最终获得风电功率的确定性预测结果以及其在不同置信度水平下的概率预测结果。研究发现基于QRF元学习策略的混合预测模型在多数情况下可以获得相对较好的概率预测结果。在90%置信水平下,该模型产生的概率预测结果几乎能够覆盖所有的真实值,这一结果能够帮助风电场的管理部门制定和控制相应的生产计划,为风电场的安全运行提供技术保障,进而减少远期市场中由于风电预测的不确定性而产生的一系列不必要的竞价机会成本。

其他文献

两种非融合术式治疗Ⅱ型和Ⅱa型Hangman骨折的疗效比较

目的比较后路C2椎弓根螺钉+"Ω"形横连内固定术与后路C1～3非融合固定术后行二期内固定取出术,这两种非融合术式治疗Ⅱ型和Ⅱa型Hangman骨折的疗效。方法回顾性分析2015年3月至2021年7月在中国人民解放军联勤保障部队第九〇四医院行不同手术方式治疗的37例Ⅱ型和Ⅱa型Hangman骨折患者。A组16例,男11例,女5例;年龄29～65岁,平均（45.6±10.2）岁;患者接受后路C2椎弓根

期刊

Hangman骨折非融合单节段固定“Ω”形横连

白龙江流域民间苯教文献研究 ——以扎拉神文本为中心

对藏族文明来说,苯教文化和佛教文化犹如车之两轮、鸟之双翼,苯教是藏文化的“根”。白龙江流域的苯教文献,是继敦煌藏文文书、菩日文书和布达拉宫档案之后新发现的一批藏文文献群,从苯教发展史的角度来说,在制度化的雍仲苯教之前,存在一种被称为世续苯教或斯巴苯教的形态,但是一直以来缺乏相关资料,白龙江流域民间苯教文献的发现弥补了这一缺憾,为国内外的藏学研究提供了新材料新视野。同时也提出了一个新问题,如何使这部

学位

白龙江流域民间苯教扎拉神文献研究

β2 integrin促进沙门氏菌入侵宿主细胞的分子机制

沙门氏菌病是一种具有重要公共卫生意义的人兽共患病,其病原沙门氏菌是一种重要的食源性致病菌,给人类的健康和食品卫生安全造成极大的威胁。病原菌与宿主细胞之间的相互作用是细菌感染入侵机制中的关键步骤。在感染过程中,沙门氏菌必然通过与宿主因子相互作用,利用或劫持宿主细胞的信号通路,成功入侵宿主细胞并抑制宿主的多种杀菌机制,实现其在细胞内存活,从而完成整个感染过程。细菌入侵宿主细胞是其建立感染的第一步,也是

学位

沙门氏菌β2 integrin沙门氏菌感染入侵机制

空间注意影响视觉工作记忆表征的认知神经机制

面对外界大量的信息输入,我们的注意力却是十分有限的,只能集中于少量信息。因此,如何利用线索示将注意引导至当前任务相关的项目显得尤为重要。空间线索引导空间注意,通常可分为两类:呈现于外周视野的外源性线索与呈现于中央视野的内源性线索。过去数十年的研究表明,这两类空间线索在选择知觉表征的过程中涉及了不同的认知加工机制。然而,除外部的现实世界外,个体还需要将注意导向内部复杂的心理世界。目前这两种空间线索对

学位

空间注意视觉工作记忆外源性线索内源性线索脑电/脑磁磁刺激

家世国难与留学经历 ——陈寅恪文化史观的发轫

陈寅恪是中国近代杰出的历史学家,但他的历史观却倍受争议。笔者经过研究发现,将陈寅恪的历史观界定为文化史观既与陈寅恪的生平所历相合,又符合陈寅恪著述所彰显的基本立场。为了对陈寅恪的文化史观进行正本清源,本文运用社会史、哲学史、学术史等研究方法,通过对陈寅恪的著述与他的家世遗风、近代遭遇、留学经历的对应式研究,比较全面地揭示了陈寅恪文化史观的历史基础和思想资源。除“绪论”和“结论”,正文共分五章。第一

学位

陈寅恪文化史观发轫家世国难留学经历

Managerial Capabilities and Firms’ Sustainable Performance: Evidence from Chinese Small and Medium E

The failure rates of small and medium enterprises（SMEs）in developing countries have been very high,with many of them closing down within the first five years of operation.This research seeks to tackle

学位

价值链分工下中国贸易的碳排放效应研究

随着以价值链分工为特征的新生产分工体系的形成,国家或地区间生产分工与贸易模式发生了较大变化,呈现出从最终品贸易逐渐转变为中间品贸易,从产品间贸易逐渐转变为产品内贸易,且加工贸易在全球盛行。这种新生产分工模式一方面促使经济全球化和贸易往来迅猛发展,形成了复杂的全球生产网络,另一方面也造成碳排放实际产生地的分离,一国或地区可通过减少本国生产而增加进口消费达到减少本国或地区内污染排放的目的。这意味着,价

学位

价值链分工碳排放效应投入产出模型贸易类型结构分解分析

清代内务府世家高佳氏研究

高佳氏是清代中期崛起的内务府世家。该家族由出身卑微的包衣崛起为世代簪缨的权贵,在内务府世家中颇具典型性。而在内务府满洲、蒙古、汉姓世家中,高佳氏又以其多重特性而独具一格:地位尊崇且联姻帝室,虽为汉姓却高度满洲化,未以军功起家却屡立战功,鲜少科举入仕却痴迷儒家文化,父子叔侄相继被诛家族却并未一蹶不振。有关高佳氏一族兴衰之迹,学界尚少系统、全面的考察。本文裒集满汉文档案文献,对高佳氏的发展脉络作较为系

学位

内务府汉姓满洲权贵高佳氏婚姻抬旗贪腐社会关系

Factors Affecting Ceramic Entrepreneurship Development in Lampang Thailand

Ceramic competition situation in which small and medium ceramic entrepreneurs in Thailand are various of competition and product model copying.This thesis aims to examine the profit profit performance

学位

Human Umbilical Cord Mesenchymal Stem Cells Alleviate Inflammatory Bowel Disease through Inhibiting

背景:炎症性肠病（IBD）反映了结肠和/或小肠的炎性情形,该病的主要类型包括克罗恩病和溃疡性结肠炎。IBD是一类复杂的疾病,由环境和遗传等不同因素相互作用进而引起肠道过度免疫应答和炎症。在IBD中,免疫系统处于过度活跃状态。间充质干细胞（MSCs）是一种可以从许多组织（包括骨髓和脂肪组织）中分离出来的多潜能基质细胞,由于其免疫调节能力,已被应用于研究治疗IBD。中性粒细胞（也称为中性白细胞）是哺乳

学位

间充质干细胞炎症性肠病中性粒细胞ERKN2极化

基于机器学习算法的时间序列组合及混合预测模型的研究与应用

与本文相关的学术论文