论文部分内容阅读
随着移动互联网的迅速发展,人类进入数据时代。大数据带来的信息风暴正深刻改变着人们的生活、工作和思维方式。互联网大数据呈现出海量性、多样性、高速性、易变性的特点,为量化投资提供了新的数据来源。纵观海内外,量化投资下的互联网大数据领域,无疑是当前量化投资新的研究方向和热门领域。现代金融市场理论通常假设市场上的每个投资者都是完全理性的,然而现实中的金融市场并不支持这一假设,尤其在A股市场上个人投资者占比较高,卖空存在限制,股价异象繁生等。在这样的背景下,行为金融学异军突起,从人们的行为特征、投资心理等多个角度进行分析和研究。本文借助微博这个平台,尝试将网络舆情数据与华谊兄弟的股价波动问题联系起来,从舆情数据的变化中挖掘出华谊兄弟股价波动的相关规律,将有助于企业管理者基于微博这个维度直观地评估网络舆情对其经营等造成的影响,从而更有针对性地采取措施予以应对,另一方面也有助于投资者更好地预测企业股价的变化趋势。一般的基本面数据、宏观数据、资产行情数据在捕捉投资者的情绪变化方面显得力不从心。相比之下,互联网舆情数据可及时描述投资者的情绪面。尤其当今时代,信息技术及网络平台日新月异,越来越多中小投资者更加依赖于网络,企图从中获得更多信息以便做出投资决策。与此同时,并通过各个不同的网络社区来表达自己的投资观点,比如:微博、微信、股吧、股票论坛等等。而通过文本数据挖掘、情感分析、用户行为分析等方法可以得到不同维度的舆情数据,如投资者对不同话题的关注度、投资者对不同事件的情感倾向、不同事件之间的相互关联等。在众多的数据源中,基于微博的网络舆情代表了人们对某一主体的关注度情况,本文将这种关注度结合情感分析来构建投资者情绪指数,以此来研究舆情变化的强弱与华谊兄弟股价波动之间的关系。本文首先采用python爬取新浪微博上的股评文本,运用特征分类方法构造出分类器来对文本进行情感分析,根据分析结果构建投资者情绪指数。为研究基于微博的网络舆情与华谊兄弟股价波动的相互关系,本文对情绪指数和股市的价、量指标,即华谊兄弟个股收益率、成交量变动率、换手率变动率分别进行平稳性检验和因果关系检验,并建立向量自回归模型,随之发现投资者情绪指数是华谊兄弟个股收益率的格兰杰原因,而与个股交易量变动、个股换手率变动之间不存在格兰杰因果关系;另一方面,本文针对华谊兄弟建立个股的收益率预测模型,发现添加舆情指标之后的模型能更好地解释股价的变化,说明我国证券市场的发展尚未成熟。