论文部分内容阅读
沪深300指数代表了中国股市的整体情况,反映了我国经济发展的总体趋势。同时,沪深300指数是第一个反映中国证券市场总体风貌的股价指数,可以用于观察股票市场的走势,为个人投资者提供重要标准。所以,沪深300指数的精确预测值,无论对政府监管还是个人投资者都具有重大意义。本文主要目的是建立一个集沪深300指数影响因素分析、数据噪声消除、输入变量选择及支持向量机为一体的组合预测模型。针对金融时间序列典型非线性并且含有噪声的特点,本文使用集合经验模型分解算法(EEMD)来提取并消除数据的噪声,同时采用具有强大非线性建模能力的支持向量回归(SVR)。为了避免影响变量过少而存在的片面性,本文尽可能多地选取了影响变量。但是过多的影响变量会产生重复信息,重复信息使用方差膨胀因子方法(VIF)诊断并删除。同时,针对我国股市易受政策影响,导致股市数据波动剧烈,采用了基于属性熵的多变量数据异常值诊断方法(ODAE)。最后,为了简化模型结构和加快计算速度,本文还使用了适合非线性模型的变量筛选方法,平均影响值方法(MIV)。根据这些策略本文建立一个合理的和科学的符合我国股市特征的预测模型,ODAE-VIF-EEMD-MIV-SVR模型。在实证分析中,数据时间范围是2010年4月16日到2014年12月31日,其中训练集时间从2010年4月16日到2013年12月31日;测试集时间从2014年1月2日到2014年12月31日。实证结果表明:(1)ODAE-VIF-EEMD-MIV-SVR预测性能最好,其平均百分误差(MAPE)、平均绝对误差(MAE)、归一化均方误差(NMSE)和协议指数(IA)分别为1.3860、26.3832、3.6667*104和0.9916。盒须图分析结果表明,其相对误差是一个均值为0的白噪声序列;(2)各策略对组合预测算法贡献度从大到小的顺序为:VIF重复信息处理方法,EEMD去噪,ODAE异常值诊断,MIV输入变量选择;(3)预测结果对沪深300指数期货的涨和跌的正确率接近60%,具有一定的参考价值。