论文部分内容阅读
随着互联网技术的迅速发展,社交网络得到越来越广泛的应用,社交网络不仅成为人们相互沟通交流的主渠道,而且也已经成为人们参与社会公共问题讨论、宣泄自己想法和情绪的主渠道。深入分析和挖掘社交平台上公众所发布的信息,已经成为及时了解和把握公众情绪的有效方式。近年来针对不同应用领域,如何充分利用社交平台信息,及时分析和把握相关的发展趋势,不仅被越来越多的企业和政府部门所关注,而且也已成为学者们的热点研究问题之一。在我国微博平台是一个具有很大受众面、开放性的社交平台,微博平台的信息能够比较好地从一个侧面映射公众对经济和社会问题的想法,国内已有一些学者结合相关领域开展了一些微博信息分析和应用的研究,取得了一些初步成果。本文在对微博情绪分析方法研究的基础上,讨论微博情绪与我国股票市场波动之间的关系。理论研究上,论文首先界定了公众情绪、微博情绪和情绪指数等概念,其次在已有研究成果的基础上提出了基于多策略分类方法的微博情绪指数的构建过程。从分类过程上,采用两步三分类,即所有信息文本的主客观分类和主观信息文本的褒贬分类,最终将所有信息文本分为中性(客观信息)、积极文本和消极文本三类。从分类方法上,本文提出对信息文本分别构建向量空间模型和情感特征模型,对两个模型分别采用支持向量机(SVC)、LR(逻辑回归)和NB(朴素贝叶斯)三种分类算法对文本进行分类,进一步设计了对6种分类结果进行优选的最大投票机制。详细阐述了分类过程中所应用的方法和基于微博文本分类结果微博情绪指数构建的方法。实际应用研究上,论文首先以采用爬虫技术从新浪微博平台上获取的数据为研究对象,阐述了数据的获取和预处理过程,应用所提出的方法,完成了新浪微博股票投资情绪指数的构建。其次,论文对股票市场选取了相关的因变量和自变量,并将计算的微博股票投资情绪作为自变量,一方面研究了微博情绪指数与所选定股票市场波动性指标之间的相关性,通过格兰杰因果检验筛选出与股票市场波动性指标相关的微博股票投资情绪指标,另一方面研究了微博股票投资情绪指标对股票市场预测准确性的影响。研究表明看涨指数(DBI)和简单情感指数(DSSI)与股票市场波动指标具有相关性,且同时考虑微博情绪指数和股票市场成交量指标的预测模型具有最高的预测准确率。