论文部分内容阅读
基于金融低频数据的预测,在时间上具有持久性,依托于整体的金融环境,短期内往往难以得到满意的预测效果。而在当今大数据时代,得益于计算机、通讯与信息存储技术的高速发展,股票投资者可以更加方便并及时获取股票市场的各种交易数据,逐分钟甚至逐笔交易数据的获取、操作与分析也变得可行。高频率金融数据富含更多信息,对捕捉股市微观变化十分显著,因此,通过运用高频金融时间序列来预测短期内股票价格趋势,可以更精准的规避风险并获得更理想的回报。当下取得研究成果最显著及应用最普遍的神经网络的便是BP(Back Propagation)神经网络模型。BP神经网络作为一个并行且具有非线性的复杂动力学系统,它基于误差反向传播的算法,使得它也能够展现出一个非常复杂的非线性系统。然而,由于输入数据对BP神经网络的性能影响很大,非平稳及波动性强的高频率金融数据可能会干扰网络,导致输出误差变大,因此由传统的BP神经网络算法而得的预测结果不理想。经验模态分解(Empirical Mode Decomposition)简称EMD算法,在1998年由Huang等人在研究非平稳及非线性等一些问题时提出来的。此方法自适应地把一个不平稳序列不断分解,分解成若干个具备信号原始特征的本征模态函数(IMF)以及一个余项,这个特性从根本上减轻复杂数据的干扰起到了平稳化作用并保留原始数据中最大量的信息。另外EMD它还有一个自适应的特性,这点使得它更加适合一些非平稳及非线性复杂序列的分析。为建立更精准的股票价格短期预测模型,本文依据分解重构的思路提出基于高频数据的EMD-BP神经网络算法:首先运用EMD算法将原始价格序列分解为有限个IMF分量及残余项,将所有分量与原始价格序列进行相关性分析后,运用BP神经网络对相关性高的各个分量以及低相关性分量组合而成的新分量分别进行滚动预测,最后将以上各分量的预测值等权求和重构为最终预测结果。本文以沪深300指数为实证研究对象,基于其1分钟收盘价高频数据及日收盘价低频数据,运用本文所提出的EMD-BP网络算法以及BP神经网络算法进行滚动预测,并采用均方误差(MSE)、绝对平均误差(MAE)和相对平均误差绝对值(MAPE)三种性能指标对这四组预测结果进行评估。实验结果表明:股票价格预测中,基于高频数据的模型预测效果优于基于低频数据的模型预测效果,EMD-BP网络模型预测效果优于传统的BP网络模型预测效果。综合而言,基于高频数据的EMD-BP神经网络模型可以对金融市场的波动趋势进行一个更精确的预测,对金融风险的识别和风险管控意义重大。