论文部分内容阅读
大数据信息和股票改革是近年来经济发展热点,探索大数据信息作用于股票市场投资领域的机制就具有十分重要的现实意义。国内外的理论研究和实践证明,投资者情绪对股票市场未来趋势具有一定的预测作用与溢出效应,但对于利用大数据网络搜索信息构造股票市场先行情绪指标的研究仍然存在空白;我国作为世界第二经济大体,拥有上海证券交易所与深圳证券交易所两个证券交易市场,它们是我国资本流通的主要市场,是经济发展的主要风向标。因此基于网络搜索信息构造适应我国股票市场的投资者情绪指数,并探究投资者情绪与股票市场之间的相互溢出效应就具有一定的理论和研究价值。本文综合运用统计学、时间序列模型、金融学等理论方法,借鉴国内外关于投资者情绪与股票市场的研究成果和实践经验,对我国沪深投资者情绪与股票市场进行多维度的研究。本文在深入理解投资者情绪与股票市场内涵的基础上,首先利用文本挖掘技术构造以“股票市场”为核心的谷歌网络搜索初始词库,随后利用时差相关系数法、随机森林、CART、神经网络等算法对260多个候选关键词进行信息约简,并利用主成分和随机森林重要性方法分别构造了具有先行预测作用的沪深两市投资者情绪指数;其次利用VAR(n)-BEKK(1,1)-GARCH模型分别探讨了沪深投资者情绪与股票市场指数、沪深投资者情绪等三种关系之间的溢出效应机制,最后基于它们之间的溢出效应关系对投资者情绪与股票市场进行综合评价。主要结论有:一是随机森林算法具有较好的变量筛选作用;二是社会文本信息与网络数据对推断我国投资者情绪具有良好的信息参考价值;三是基于谷歌网络搜索数据所构建的投资者情绪对沪深两市具有良好的预测作用;四是投资者情绪在沪深两市、不同时期存在差异;五是沪深两市的投资情绪与市场指数之间存在联动机制;六是沪深两市的投资者情绪与市场指数都存在较强烈的波动反自身性;七是沪深两市的投资者情绪与市场指数分别存在双向溢出效应;八是沪深两市投资者情绪存在跨市溢出效应。