论文部分内容阅读
股票市场在证券业和金融业中扮演着重要的角色,股票市场是宏观经济也是股民心情的“晴雨表”,任何国家的经济发展都离不开股票市场的发展。有效的股票市场预测,对企业和投资者来说,是其投资成功与否的关键所在,预测越准确,对风险的防范也就越有把握;对国家的经济发展而言,是宏观经济政策制定重要指标,预测越准确,对市场风险调控能力越强,因此对股票市场进行正确分析和预测就显得尤为重要了,但是由于股票市场受到社会、政治、经济、文化以及投资人心理等诸多复杂的因素的影响,再加上这些影响因素的不确定性,预测股票市场的难度大大增加。作为行为金融学的主要理论部分,有限关注理论认为:投资者由于个人注意力和精力的有限性,并不能充分获取并理解全部的信息,而是更倾向于关注自己所感兴趣的信息。随着互联网搜索引擎的到来,利用互联网引擎进行信息搜索便成了投资者日常搜索的主要选择,而投资者的搜索记录与次数也会被统统记录下来,这为我们直接衡量投资者的关注度提供了精确的数据,也为利用投资者关注度预测股票市场提供了可能性。股票市场作为一组时间序列,其非线性和动态性,使得学者们开始从传统时间序列分析模型向人工智能能分析转变。循环神经网络(Recurrent Neural Network RNN)是机器学习领域中较多应用于时间序列预测的一种神经网络,而长短期记忆网络(Long Short-Term Memory LSTM)作为循环神经网络的一种变体,更善于发掘时间序列数据之间的长期依存关系,因此更适合于股票市场预测。本文首先基于百度指数的智能推荐引擎构建关键词词库,并以其搜索量作为投资者关注度指标,利用LSTM深度神经网络对上证综合指数涨跌进行建模预测。研究中,本文利用LSTM深度神经网络对上证综合指数进行预测,结果显示基于百度指数构建的投资者关注度指标对上证指数涨跌具有很好的预测作用。其次,通过对不同优化方法以及不同特征关键词的选取,LSTM模型精度进一步提升。最后通过对比,来自PC端的用户搜索量和对来自移动端的用户搜索量对上证指数涨跌的预测能力相当。本文在构建投资者关注度指标方法在前人基础上进一步创新,通过百度搜索推荐引擎构造相关关键词库,并使用随机森林算法对相关关键词进行重要性排序,取累计贡献前80%的相关关键词的搜索量构建投资者关注度指标;此外本文对LSTM算法预测模型进一步优化,使其准确率得到了提升。因此上述实证研究的结果不论是对个体投资者的投资决策还是对市场监管部门制定制度都具有一定的参考意义。