论文部分内容阅读
股市在市场经济中占据重要位置,但由于其发展变化受到多种因素影响,具有很强的不确定性,从而使股票投资行为存在高风险的问题。这使得如何准确且高效的对股价进行预测成为越来越多金融研究人员关注的热点问题。目前通过用多技术指标(因子)建立数学模型对股票数据进行分析预测是科研人员常用的一种方法。多技术指标的方法没有考虑投资者的情绪对股票走势的影响,但在实际生活中,投资者在做出决策时并非是完全理性的,会受到社交平台、新闻信息等多种因素的影响,导致心理情绪的变化进而调整自身决策,最终作用于股价发展的趋势。因此对影响投资者情绪的文本信息进行情感量化,进而构建精度更高的股价预测模型是目前股票市场预测领域重要的研究方向之一。
本文主要在以下三个方面开展相关工作:
第一、针对现阶段股票预测分析较少考虑投资者情绪的问题,本文提出了对投资者情绪相关文本进行情感量化,构建了基于股吧评论的社交情感指标和基于财经新闻的新闻情感指标,用于与股票技术指标融合构建股价预测模型。
第二、设计股价预测模型。由于股价涨跌受多方面因素的影响,且股票时间序列数据间具有记忆关系,而LSTM(Long and short time memory neural network)能够处理具有长期依赖的时间序列类型数据,挖掘非线性数据中隐藏的信息,因而本文基于LSTM构建股价预测模型。并且本文针对模型的整体结构和其中的各个超参数的取值进行了详细分析和设置。
第三、对构建的预测模型进行训练和测试。本文综合考虑选取了29个技术指标,并分别以技术指标、技术指标+社交情感指标和技术指标+社交情感指标+新闻情感指标作为输入特征,构建了三个股价预测模型。并分别对模型进行了训练和测试。经过对实验结果的对比和分析,得出的结论是融合了投资者情绪的预测模型不管是在股价预测的准确度方面还是在涨跌走势准确度方面都比仅基于技术指标的预测模型效果好,其中融合多情感指标的预测模型的预测效果好于仅融合社交情感指标的预测模型。证明了融合多情感指标对股价预测模型的性能能起到积极作用。
本文主要在以下三个方面开展相关工作:
第一、针对现阶段股票预测分析较少考虑投资者情绪的问题,本文提出了对投资者情绪相关文本进行情感量化,构建了基于股吧评论的社交情感指标和基于财经新闻的新闻情感指标,用于与股票技术指标融合构建股价预测模型。
第二、设计股价预测模型。由于股价涨跌受多方面因素的影响,且股票时间序列数据间具有记忆关系,而LSTM(Long and short time memory neural network)能够处理具有长期依赖的时间序列类型数据,挖掘非线性数据中隐藏的信息,因而本文基于LSTM构建股价预测模型。并且本文针对模型的整体结构和其中的各个超参数的取值进行了详细分析和设置。
第三、对构建的预测模型进行训练和测试。本文综合考虑选取了29个技术指标,并分别以技术指标、技术指标+社交情感指标和技术指标+社交情感指标+新闻情感指标作为输入特征,构建了三个股价预测模型。并分别对模型进行了训练和测试。经过对实验结果的对比和分析,得出的结论是融合了投资者情绪的预测模型不管是在股价预测的准确度方面还是在涨跌走势准确度方面都比仅基于技术指标的预测模型效果好,其中融合多情感指标的预测模型的预测效果好于仅融合社交情感指标的预测模型。证明了融合多情感指标对股价预测模型的性能能起到积极作用。