论文部分内容阅读
大数据时代,企业期望利用各种网络大数据进行投资策略的分析与构建,以获得更高的稳定收益。媒体对股票市场表现的影响,一方面涉及媒体对投资者情绪的影响,另一方面涉及投资者非理性行为在市场综合层面的表现,对该问题的研究将有助于对金融市场的理解与认知,同时对行为金融学的相关理论进行有益的补充与完善。 本文首先分析了我国股票市场的特征,并与国外股票市场进行对比研究。其次,通过基于百度搜索引擎抓取到的网络新闻样本,构建了媒体关注度和媒体情绪指数,并从大盘指数和行业指数两个层面分别研究了网络新闻媒体对我国股票市场的影响,同时考虑了我国股票市场的实际特征。最后基于影响机制的研究结果,构建了我国股票市场的预测模型,主要考察了网络新闻媒体相关指标的预测能力。本文的主要研究发现如下: (1)星期效应从侧面反应了每个国家投资者的交易习惯,上海和深圳股票市场的收益率存在明显的周一和周四效应,而且即使分年份单独考虑,该效应在多数年份依然存在,尤其是在近年来,周四的负收益现象更加明显。复杂网络方法从另一角度验证了我国股票市场星期效应的存在,同时指出星期效应具有一定的持续性,即在相邻时间段内的星期效应表现趋于一致。这是因为受到我国独特的文化传统的影响。 (2)网络新闻媒体对股票市场具有影响。网络新闻媒体是许多投资者,尤其是个体投资者的主要信息来源,而个体投资者的信息处理能力有限,以及专业投资知识匮乏,导致网络新闻的影响作用进一步加深。我们的研究指出媒体的关注度和媒体的情绪都会对股票市场的表现产生影响。针对具体不同的情绪而言,中立情绪对我国股票市场的影响具有特殊性,其扮演着负向情绪的作用,但是相比于负向情绪其表现更为显著。 (3)网络新闻媒体对股票市场的影响,受到股票市场、星期效应等因素的调节。首先,由于上海股票市场和深圳股票市场的构成不同,而且上证综指和深证成指的指数构造方法存在差异,所以网络新闻媒体在两个市场的影响效应存在一些差异。其次,我们的研究表明星期效应对网络新闻媒体在股票市场的影响具有干预调节作用,尤其是在周一,比如考虑对收益率的影响,网络新闻所包含的正向情绪对收益率的正向影响在周一时会显著降低。第三,股票市场处于不同的阶段时,网络新闻媒体产生的影响也存在差异,表明整体环境背景会影响投资者对网络新闻的接收与理解,进而影响其投资决策。 (4)在行业指数层面,投资者同样受到网络新闻媒体效应的影响。通过对行业指数之间的相关性分析,指出上证金融行业指数占据重要的位置,尤其是近年来其重要性逐步提升。通过以行业指数的成分股的股票名称为筛选准则,筛选出的新闻样本对上证金融行业指数并不具有显著影响,而通过整体新闻样本对上证金融行业指数的分析则表明,网络新闻媒体对上证金融指数具有类似于大盘指数的影响。通过对比已有研究成果,指出仅以成分股的股票名称为准则筛选出的新闻样本并不具有代表性,在对行业指数进行精确新闻匹配时除了要考虑成分股的名称外,还需要考虑其他影响因素。 (5)在股票市场的预测模型中引入媒体关注度和媒体情绪指标能够在一定程度上提高预测精度。一方面,引入网络新闻媒体相关的指标,能够提高对股票市场未来走势的预测,另一方面,正确设定模型形式对提高预测效果具有重要的作用。 本文的主要特色和创新如下: (1)基于抓取到的网络新闻样本,构建适用于我国股票市场分析的情感词典,并计算情感指数和舆情指数。普通的情感词典一般是基于普通语料库得到的,而股票市场上一些词汇具有特殊的含义,因此通过人工标注与添加,对已有情感词典进行完善能够更加精确的捕捉股票市场相关新闻中所表达的情感倾向。通过将基于词典的分析方法与人工标注法相结合,完善了自然语言处理领域关于情感标注模块的相关理论体系。 (2)将复杂网络的方法引入对股票时间序列的分析中,首次发现其结果可以与传统的时间序列分析方法的结果进行相互验证。已有的研究或利用传统方法对股票市场特征进行统计,或利用复杂网络方法来研究市场的网络拓扑结构,而本文指出这两种方法可以同时使用,且结果可以相互验证,一方面丰富了金融时间序列研究的理论体系,另一方面也为今后的研究提供了新的方法切入点。 (3)第一次明确提出新闻媒体报道所包含的中立情绪在我国股票市场上的重要影响。由于我国的文化传统,新闻媒体对事件的报道具有一定的倾向性,且在语言的运用上具有艺术性,因此中立情绪在我国股票市场上扮演着负向情绪的角色,但比负向情绪的效应更加显著且持续。本文通过一系列实证检验及鲁棒性分析,确认了中立情绪的重要性。这一方面促使采用更加审慎的视角来看待新闻媒体的报道,另一方面从理论上丰富了行为金融的研究成果。 (4)系统性的考虑了我国股票市场的多方面特征,包括记忆性、星期效应等,并区分股票的上涨、下跌与平稳时期,利用交互作用模型分别研究不同情境下新闻媒体对股票市场的影响。与传统的研究新闻媒体与股票市场之间关系的文献相比,发现新闻媒体所产生的影响是有条件性的,且随所处的情境的变化而变化,因此对不同情境下的新闻媒体应该区别对待,尤其作为投资者,不应盲目依赖新闻媒体的报道,而应在进行理性全面的分析之后再制定投资决策。 (5)本文通过对上证行业指数和上证综指的对比,发现网络新闻媒体对不同层面的综合指数具有类似的影响,但是新闻样本的选择与匹配是需要重点关注的问题。相比于完全精确的匹配,与股票市场相关的全量新闻样本对所有指数的影响都是最显著的。这是首次明确提出新闻样本和股票指数的样本匹配问题,我们的结论表明在进行股票市场的新闻媒体效应分析时,对新闻样本的搜集应该尽量求全,而过于精确的新闻样本会损失较多信息,进而产生偏误。