论文部分内容阅读
股价综合反映上市公司市值波动及金融流动资金走向,那么如何更准确的预测股价成为股市领域的研究重点。但是股票市场往往受到各方面信息和操作的影响,股价涨跌趋势存在巨大波动性,准确预测变得十分困难。最近几年,以机器学习算法为基础的大数据分析发展迅速,将其运用至机器翻译、图像识别等多个领域均取得了良好的效果。因此研究金融领域的学者们尝试将这些算法应用至股市,无论是对股票分类还是预测股价趋势,机器学习算法技术相较于传统理论方法准确率有很大提高。而机器学习算法中,LSTM神经网络因其特殊的门结构可更有效的处理金融数据;XGBoost集成学习算法具有运算速度快、准确率高的特点。因此论文选择这两种算法对股价进行预测,为投资者提供参考和建议。论文结合沪深300指数和中证500指数,首先运用传递熵的方法检验了收盘价与其余各个变量之间的非线性因果关系;其次选用LSTM神经网络和XGBoost集成学习算法建立股价预测模型,针对最优投资时间窗口、量价关系、高低频数据三个部分考虑股价影响收益的因素,主要的研究工作如下:(1)选取投资时间窗口周期为21、34、55个交易日,探究哪个周期内收益值最大;(2)在LSTM模型中以“收盘价”和“收盘价+成交量”作为输入量,比较其策略收益和随机收益;(3)运用XGBoost集成学习算法对五分钟高频数据和日低频数据,以策略收益衡量哪类数据的预测效果更好。分析表明:在股市中,最优投资时间窗口周期为55个交易日;LSTM模型中以“收盘价+成交量”为输入量时可取得更高收益;相比于低频数据,使用高频数据在XGBoost模型中预测股价进而取得收益的效果更好。可以看出,深度学习算法对股市预测和投资有一定的指导意义,同时给投资者决策提供了一个方便、切实可行的方案。