论文部分内容阅读
股票价格的波动变化影响着社会经济生活中的方方面面,因此有效预测出股价变化趋势具有较大的经济与社会价值。股票预测的基本思路是通过已有历史数据中自动抽取的规律来预测未来股市的变化。传统的股票预测模型采取的是基于股票时间序列分析的预测模型,但时间序列模型无法考虑投资者情绪对于股市变化的影响。为了利用投资者情感信息对股市行情做出更准确的预测,本文建立了一种基于LSTM和投资者情绪的股票行情预测模型,本文的研究工作主要包含如下两个方面:第一,建立了一种基于LSTM的股票行情预测模型,该模型采用LSTM来直接对股价时序序列进行建模,并在此基础上融入基本情感特征来增强模型预测性能。LSTM模型是递归神经网络模型中的一种,比起一般的神经网络模型可以更有效的学习长期依赖关系中的规律,因此本文在时间序列理论的基础上,建立了基于LSTM的时间序列模型,与基于时间序列的经典模型相比,该模型在预测的准确性上有了一定的提高,并且针对经典模型忽略了投资者情绪对于股市变化的影响,本文利用基于情感词典的文本分析方法提取了股市文本中的情感特征,并将此特征和股价时序序列结合,构建了融合基本情感特征的LSTM模型,该模型与基于LSTM的时间序列模型相比,在准确性上有了明显的提升。第二、在上面模型的基础上,在情感提取层面上提出采用CNN抽取深度情感信息来替换基本情感特征。在数据源层面上引入基本面特征等额外信息源,以此进一步提升模型预测性能。由于基于情感词典的文本分析方法在很大程度上依赖于词典本身的质量以及覆盖度。因此本文利用CNN结合词向量对文本进行情感分析,并将得到的特征与股价时序序列结合,构建了融合深度情感特征的股票预测模型。经过实验融合深度情感特征的股票预测模型与融合基本情感特征的LSTM模型相比,在实验的准确性上有了较大幅度的提升。这证明了 CNN能够更有效的提取出文本中的情感极性,进而提升模型预测的准确性。在数据源方面,进一步加入了基本面特征的信息源,经过实验,模型准确性得到了进一步的提升,这也证明了多信息源比起单一信息源能更有效的提升模型预测准确性。