神经网络及其组合模型在时间序列预测中的研究与应用

来源 :兰州大学 | 被引量 : 30次 | 上传用户:lovegyyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列能够反映工业、经济、气象、交通、能源等各个领域中的不同现象和过程,客观地记录这些现象和过程的演变规律。如果能够很好地掌握和运用这些规律,就可以规避风险、优化配置和节约能源,因此时间序列的分析与研究具有十分重大的现实意义。预测是一种时间序列的分析方式,能够依据有限的历史数据资料,运用数理统计、随机过程理论和机器学习方法研究数据中潜在的依存关系,进而刻画和了解待分析对象的演变规律,并对其未来的发展趋势作出估计和判断。传统的统计预测模型擅长于刻画数据依存关系中的线性关系,但在面对现实世界中高度复杂的系统所表现出来的非线性特征时,该类方法的预测精度就会明显降低。随着现代人工神经网络理论的进一步发展,这种模拟人脑思维方式的数学抽象模型在特征学习、数据压缩、模式识别、时间序列预测等领域均获得了较大的成功。神经网络多是以一定数量的人工神经元构成的隐含层或具有隐含层表达能力的结构,如储备池等来抽象和学习数据间的依存关系。相比较传统的统计预测模型,这种灵活的结构更能捕获现实世界中复杂的数据关系,尤其是非线性数据关系。为了克服现有预测模型在自适应学习、数据特征的分离提取和高层抽象学习等方面的不足,本文依托于神经网络强大的函数逼近能力,采用诸如数据预处理、元启发式优化算法、多储备池计算等手段,并结合统计模型的固有优势,提出了四个新的基于神经网络的预测模型:(1)基于BPNN(Back Propagation Neural Network)的数据驱动组合预测模型。针对传统统计模型无法精确刻画现实系统复杂的非线性特征的问题,提出了一种数据驱动的神经网络预测模型。该模型首先利用集成经验模态分解技术EEMD(Ensemble Empirical Mode Decomposition)将原始时序数据分解为多个具有不同震荡模式的本征模态函数IMFs(Intrinsic Mode Functions)和残差(Residual),消除序列中的噪声成分,获取能够反映原始数据特征的近似序列。然后,在这个近似序列上利用优化的后向传播神经网络学习数据间的依存关系,优化机制则采用一个改进的花朵授粉算法CSFPA(Chaotic Self-adaptive Flower Pollination Algorithm)来实现。(2)基于ARIMA–ESN(Autoregressive Integrated Moving Average–Echo State Network)的线性–非线性组合预测模型。针对传统带权的线性—非线性组合模型在捕获数据特征时,只是在原始数据空间中利用权重来表达各个基本方法的贡献,不能充分发挥这些方法的优势这一问题,提出了一种基于分治策略的组合预测模型。该模型首先在原始数据空间中提取具有局部线性特征和非线性特征的子序列,然后利用线性的ARIMA和非线性的ESN分别捕获这两个子序列的数据模式。由于数据的非线性特征会极大地影响预测精度,因此采用一个新式的WOA(Whale Optimization Algorithm)算法帮助ESN提高储备池的学习能力。(3)基于储备池结构优化的ESN预测模型。针对储备池结构在本质上可以动态地反映网络的非线性学习能力,不合适的输入响应会对预测结果产生消极的影响这一问题,提出了一个改进的二进制共生生物搜索算法(Binary Symbiotic Organisms Search,BSOS)和基于此算法的ESN预测模型。所提的二进制搜索算法BSOS利用一个v-型的传递函数实现表达神经元连接的二进制变量是否需要翻转的功能,由此来决定储备池内部的神经元连接状态。在该算法的作用下,ESN对于输入信号的学习能力能够实现最大化。(4)基于深度储备池结构的ESN预测模型。针对现有深度结构的ESN在学习过程中面临的多储备池采样规模较大的问题,提出了一种改进的深度ESN预测模型。该模型只需顶层的储备池参与状态采样,由此可以缩小储备池状态矩阵的规模并简化网络输出权重的计算。所提的深度ESN由泄漏积分型神经元(Leaky Integrator Neuron)构建而成,在多个与环境相关的数据集上均表现出了较好的预测能力,并且能够使得网络的输出权重不会出现过大的情况。
其他文献
在工业生产中,各种计算机系统在不同控制领域得到了广泛应用。但是长期以来,它们之间普遍不能进行有效的通信,其中最关键的问题就是接口的不标准。OPC(OLE for Process Contr
随着信息服务业的不断发展,基于用户个性化的主动信息服务作为一个新的研究热点和一种新型的信息服务模式,得到了越来越多的关注。本论文对旅游多媒体信息主动服务系统进行了
随着多媒体技术在网络和人们生活中的广泛应用,近年来,多媒体数据库管理系统(MMDBMS)方面的研究倍受关注。多媒体类型繁多,结构复杂,语义丰富。当前已有的MMDBMS 缺乏对各种媒体
文本分类是大规模文本处理的基本功能,也是提高其他文本处理功能和质量的有效手段。通过文本分类,人们可以按类别进行文本存储、检索和进一步处理。因此,迅速有效地对文本进
近年来,自动取款机(ATM)在各商业银行大量投入使用,在方便用户存取款的同时,也带来了越来越多的ATM机纠纷案件和金融犯罪,而目前的银行系统由于缺乏智能化监控手段导致此类犯
隐喻的机器处理已成为自然语言处理研究中的热门课题,隐喻处理的好坏将直接影响到机器对自然语言理解的程度,并对机器翻译、搜索引擎和情感计算等领域有着重要的推动作用。隐喻
随着网络技术的发展,网络应用的不断增多,网络带宽的不断增大,用户个性化服务需求的不断增强,用户对旅游景区在线视频的需求也会越来越大。旅游景区在线视频主动服务系统通过
空间数据模型是GIS空间数据组织和数据处理算法设计的理论基础,对地理信息系统的发展有决定性作用。Internet的飞速发展使得人们对于Web环境下的空间信息的获取需求日益明显,
如何对图像内容进行识别并确保它的真实性和完整性是信息安全领域的研究热点。图像感知哈希通过合理方法对图像数据进行降维处理,用能够表示图像本质内容的感知摘要来表征原
图像分割是图像处理的重点和难点之一,至今仍然没有一个通用且有效的图像分割算法能满足各种不同的需要,这也正是图像分割算法的研究价值所在。在医学图像处理中,虽然支持向量机