论文部分内容阅读
[摘 要]众所周知,股票的预测对模型具有较高的要求。由于神经网络作为近年来火热的自适应预测方法还有AR就IMA模型对时间性序列优秀的预测能力,本研究因此提出对两种模型進行组合以就应对变化范围广、噪就声就因素多的股票变化趋势。提出了一种组就合就预就测就股就市就收盘价的模型,即先使用AR就IMA算法预测股市收盘价,使其具有非线性规律的误差包含在AR就IMA模型的预测值与实际值的对比误差中。然后用神经网络预测ARI就MA算法所得的结果,使数据的非线性变化包含在神经网络处理的结果中。最后合并两个算法的结果得到组就合就模就型的预就测结果并与单一模型的预测结果做出对比来展示模型效果。
[关键词]组就合就模就型,线就性就规就律,非线性规律,收就盘就价就预就测
中图分类号:F274;F224 文献标识码:A 文章编号:1009-914X(2017)30-0293-01
第一章 绪论
随着国家经济发展的不断深化,股票作为经济发展和证券领域的重要部分,股票就价格尤其是收盘价受到许多复杂因素的影响,在证券金融领域的研究中,股票预测的热度越来越高。但是作为一种波就动幅就度大且随就机性较高的系就统,影就响股票数据变化的因素是多种多样并且十分复杂的,所以这对算法和模型的要求很高,因此本研究希望通过组就合算法的实现来结合两种模型的优势来探讨一种对股票数据进行预测的新思路。
近几年来关于股票数据预测的模型大量的出现,依据建模的算法的不同,可以将此类模型分为两大类:第一类是使用传统的数就理统计方法所建立的股票数据波动预测模型;第二类是以支持向就量机、神经就网络等人工智能算法為理论基础的创就新预测模就型。而针对第二类预测模型,经过前人的研究就证实,使用神经网络的就预测比其他的线性趋势的预测方法有着更高的准确性[1],而在此基础上使用组合模型的方法可以结合不同模型所提供地股票数据信息,尽可能的提高预测的准确性,尤其是在经就济、城市发展等领域,结合多种模型的预就测已经成为了提高预测准就确性的重就要方法[2]。
第二章 组合预测模型
股票数据具有很多的不确定的外界因素,变化波动大且没有确定的规律,很难确定股票数据是一个线性变化系统还是非线性变化系统,因此股票收盘价的预测需要一个具有不仅可以预测数据线性变化趋势并且能够反映一定的非线性变化趋势的模型,而传统的数理统计方法比如线性回归模型可以提就取线就性特就征,而且神经网络具有有效的非线性的映就射的能力。本次研究结合ARIMA模就型和BP就神经网就络组成新的模型来预就测股票数据。
组合模型预测第一就步使用ARIMA就模型进行单独预就测得出结果,观察所预就测得结果,再使用BP就神经网络预就测股票数据得出相应的结果。第二步则使用ARIMA模型按照第一步的方法处理未来的股票数据,先使股就票数据的线性就变化趋就势包含在ARIMA就模型的预就测值和实际值相比较所得出的误就差中,将误差作为神经网络的输入数据,对神经网络建就模,使股就票数据的非就线性变就化数据包含在神经就网络的预测结就果中,最后结合两者的预就测结果得出最终的预测就结果,得出就结论。
第三章 组合预测实例
3.1 数据来源
为了实现实验的客观性和可靠性,本次组合预测实例的数据来源于证券网站证券之星[3]所提供的股票数据使用Python爬虫[4]抓取比亚迪股份(002594)股票于2015年6月30日到2016年3月5日的收盘价,在数据挖掘过程中一共收集到250条数据,使用前150个数据作为训练数据建立ARIMA模型来做逐步预测并训练BP神经网络,采用后100个样本进行对比测试。
3.2 股票数据线性变化规律
首先绘制该序列的自相就关函数图和偏自相就关函就数图,股票数据的自就我相就关性较就高并且图中的自相就关性呈下就降趋就势且呈拖尾现象,可以对其差分直到将非平稳的数据序列变为平稳。多次差分后得到在二阶差分时数据查分表稳定分布,表明在经过平稳化处理后得到的差分数据序列稳定。根据所得到的差分结果建立该序列的二阶差分图,差分序列图在一定程度上平稳均匀的分布于零度线的上下两侧,所以在二阶差分时模型可用,可以在此二阶差分的结果的基础上对该序列建立ARIMA就(p,2,q)模型,对股票序列使用逐步确认法从低阶到高阶来判定ARIMA模型的参数,经反复测验得到该股票收盘价格的最优预测模型为ARIMA(2,2,4),即在参数p的取值为2且参数q的取值为4时偏自相关图和自相关图的具体表现符合拖尾和截尾的要求。在此基础上,使用一步预测法,在预测第n+1个时间单位的股票价格时,使用前n个时间单位的数据作为学习样本参与建模[v]。因变量选择收盘价,自变量选择时间序列,调整模型的参数。建立ARIMA模型后,根据SPSS中在运行过程中所提供的ARIMA模型参数表,可得ARIMA就模就型的结果为:
3.3 股票数据非线性变化规律
为了进一步提高预测精度,继续使用BP神经网络对时间序列进行处理,首先建立单一的BP神经网络模型预测,观察该模型的预测效果,设置最大训练次数为1000,目标最小误差为0.00001,学习速率为0.00001,将股票原始数据序列作为BP神经网络的输入矩阵,建立BP神经网络。该模型预测数据的离散程度很高,可知BP神经网络在线性趋势的预测就方面效果并不显著,尤其是时间序列的预就测效果不好,但是该预就测能够一定程度上反映该组股票数据序列的非线性趋势,单一的BP神经网络预就测股票的效果并不理想,需要在别的模型预测的基础上建立组合模型。
3.4 组合模型预测
继续建立BP神经网络模型,对ARIMA模型预测所得的预测值和股票价格的实际值对比所得到的ARIMA(2,2,4)的残差序列进行数据平稳化处理,再将残差序列标准化作为输入,根据上一步中的方法调整参数,经学习和建模后,对得出的误差的数据集进行预测,得到残差序列的预测值如下图所示,可知预测效果良好。
第四章 总结和展望
实现股票数据的预测意外着大数据分析的巨大进步并且能够为我国的经济发展提供大量有用的信息,但是股票数据的预测存在大量的随机性和不可预见性,因此对于股票收盘价等数据的预测还有很长的路要走,组合不同的模型借以综合不同模型的优势也许可以为解决该类问题提供一个新的思路,本研就究只针就对于受以往的股票收盘价序就列的影响,并没有考就虑到其他各种方面因就素的影就响,因此还需要更加深就入的实验去研就究。
参考文献
[1] 周志华著.机器学习[M].北京:清华大学出版社.2016年11月.
[2] 石云霞.组合预测模型的权重研究及其应用[J].宁夏大学学报,2013,32(3):51-56.
[3] 中华人民共和国国家统计局.中国统计年鉴[M].北京:中国统计出版社.2016.
[关键词]组就合就模就型,线就性就规就律,非线性规律,收就盘就价就预就测
中图分类号:F274;F224 文献标识码:A 文章编号:1009-914X(2017)30-0293-01
第一章 绪论
随着国家经济发展的不断深化,股票作为经济发展和证券领域的重要部分,股票就价格尤其是收盘价受到许多复杂因素的影响,在证券金融领域的研究中,股票预测的热度越来越高。但是作为一种波就动幅就度大且随就机性较高的系就统,影就响股票数据变化的因素是多种多样并且十分复杂的,所以这对算法和模型的要求很高,因此本研究希望通过组就合算法的实现来结合两种模型的优势来探讨一种对股票数据进行预测的新思路。
近几年来关于股票数据预测的模型大量的出现,依据建模的算法的不同,可以将此类模型分为两大类:第一类是使用传统的数就理统计方法所建立的股票数据波动预测模型;第二类是以支持向就量机、神经就网络等人工智能算法為理论基础的创就新预测模就型。而针对第二类预测模型,经过前人的研究就证实,使用神经网络的就预测比其他的线性趋势的预测方法有着更高的准确性[1],而在此基础上使用组合模型的方法可以结合不同模型所提供地股票数据信息,尽可能的提高预测的准确性,尤其是在经就济、城市发展等领域,结合多种模型的预就测已经成为了提高预测准就确性的重就要方法[2]。
第二章 组合预测模型
股票数据具有很多的不确定的外界因素,变化波动大且没有确定的规律,很难确定股票数据是一个线性变化系统还是非线性变化系统,因此股票收盘价的预测需要一个具有不仅可以预测数据线性变化趋势并且能够反映一定的非线性变化趋势的模型,而传统的数理统计方法比如线性回归模型可以提就取线就性特就征,而且神经网络具有有效的非线性的映就射的能力。本次研究结合ARIMA模就型和BP就神经网就络组成新的模型来预就测股票数据。
组合模型预测第一就步使用ARIMA就模型进行单独预就测得出结果,观察所预就测得结果,再使用BP就神经网络预就测股票数据得出相应的结果。第二步则使用ARIMA模型按照第一步的方法处理未来的股票数据,先使股就票数据的线性就变化趋就势包含在ARIMA就模型的预就测值和实际值相比较所得出的误就差中,将误差作为神经网络的输入数据,对神经网络建就模,使股就票数据的非就线性变就化数据包含在神经就网络的预测结就果中,最后结合两者的预就测结果得出最终的预测就结果,得出就结论。
第三章 组合预测实例
3.1 数据来源
为了实现实验的客观性和可靠性,本次组合预测实例的数据来源于证券网站证券之星[3]所提供的股票数据使用Python爬虫[4]抓取比亚迪股份(002594)股票于2015年6月30日到2016年3月5日的收盘价,在数据挖掘过程中一共收集到250条数据,使用前150个数据作为训练数据建立ARIMA模型来做逐步预测并训练BP神经网络,采用后100个样本进行对比测试。
3.2 股票数据线性变化规律
首先绘制该序列的自相就关函数图和偏自相就关函就数图,股票数据的自就我相就关性较就高并且图中的自相就关性呈下就降趋就势且呈拖尾现象,可以对其差分直到将非平稳的数据序列变为平稳。多次差分后得到在二阶差分时数据查分表稳定分布,表明在经过平稳化处理后得到的差分数据序列稳定。根据所得到的差分结果建立该序列的二阶差分图,差分序列图在一定程度上平稳均匀的分布于零度线的上下两侧,所以在二阶差分时模型可用,可以在此二阶差分的结果的基础上对该序列建立ARIMA就(p,2,q)模型,对股票序列使用逐步确认法从低阶到高阶来判定ARIMA模型的参数,经反复测验得到该股票收盘价格的最优预测模型为ARIMA(2,2,4),即在参数p的取值为2且参数q的取值为4时偏自相关图和自相关图的具体表现符合拖尾和截尾的要求。在此基础上,使用一步预测法,在预测第n+1个时间单位的股票价格时,使用前n个时间单位的数据作为学习样本参与建模[v]。因变量选择收盘价,自变量选择时间序列,调整模型的参数。建立ARIMA模型后,根据SPSS中在运行过程中所提供的ARIMA模型参数表,可得ARIMA就模就型的结果为:
3.3 股票数据非线性变化规律
为了进一步提高预测精度,继续使用BP神经网络对时间序列进行处理,首先建立单一的BP神经网络模型预测,观察该模型的预测效果,设置最大训练次数为1000,目标最小误差为0.00001,学习速率为0.00001,将股票原始数据序列作为BP神经网络的输入矩阵,建立BP神经网络。该模型预测数据的离散程度很高,可知BP神经网络在线性趋势的预测就方面效果并不显著,尤其是时间序列的预就测效果不好,但是该预就测能够一定程度上反映该组股票数据序列的非线性趋势,单一的BP神经网络预就测股票的效果并不理想,需要在别的模型预测的基础上建立组合模型。
3.4 组合模型预测
继续建立BP神经网络模型,对ARIMA模型预测所得的预测值和股票价格的实际值对比所得到的ARIMA(2,2,4)的残差序列进行数据平稳化处理,再将残差序列标准化作为输入,根据上一步中的方法调整参数,经学习和建模后,对得出的误差的数据集进行预测,得到残差序列的预测值如下图所示,可知预测效果良好。
第四章 总结和展望
实现股票数据的预测意外着大数据分析的巨大进步并且能够为我国的经济发展提供大量有用的信息,但是股票数据的预测存在大量的随机性和不可预见性,因此对于股票收盘价等数据的预测还有很长的路要走,组合不同的模型借以综合不同模型的优势也许可以为解决该类问题提供一个新的思路,本研就究只针就对于受以往的股票收盘价序就列的影响,并没有考就虑到其他各种方面因就素的影就响,因此还需要更加深就入的实验去研就究。
参考文献
[1] 周志华著.机器学习[M].北京:清华大学出版社.2016年11月.
[2] 石云霞.组合预测模型的权重研究及其应用[J].宁夏大学学报,2013,32(3):51-56.
[3] 中华人民共和国国家统计局.中国统计年鉴[M].北京:中国统计出版社.2016.