论文部分内容阅读
资产价格的波动与媒体信息的发布、传播和吸收有密切关系。由于大部分投资者无法直接观察上市公司的运营情况,媒体就成为他们获取信息的重要渠道。媒体不是冰冷的介质,媒体内容的撰写者、编辑者以及媒体的受众都是具有思想的人。在投资者非理性的条件下,媒体影响资产价格的作用机制可以描述为“媒体-投资者-资产价格”。媒体通过影响投资者的行为,最终影响资产价格。在媒体对资产价格的影响研究中,通常的做法是将媒体内容抽象成一个因子,作为解释变量之一放入线性回归模型中。然而,随着大数据时代的来临,将媒体看作单一因子的方法难以适用于媒体对资产价格的影响研究,主要原因有两点:第一,单一因子方法忽略了丰富的媒体内容;第二,简单线性回归模型难以捕捉海量媒体信息与资产价格之间的复杂关系。有鉴于此,本研究寻求方法学上的突破:第一,提出了媒体信息的向量化方法,将媒体内容转化为n维向量,以保留媒体内容中丰富的信息;第二,提出了基于媒体感知的关联分析模型,用于捕捉媒体信息与资产价格之间的复杂关系,并评估媒体信息在短期上对资产价格的影响。在此基础上,本研究还探讨了大数据背景下的媒体在证券投资和市场监管方面的应用。本文从大数据视角研究了媒体影响证券市场的若干重要问题,主要包括以下四个方面的内容:第一、媒体信息量化。正如媒介理论家马歇尔·麦克卢汉所说,媒体(媒介)是人类感觉的拓展,它本身又是讯息的一部分。因此,媒体不仅是信息的载体,更是人类情绪的载体。传统研究方法将媒体内容浓缩成一个“因子”或“一点”,即“一点式方法”,丰富的媒体内容因而严重失真。本研究提出了媒体的向量化方法,把文字内容中的名词作为“基本面信息”的代表,把心理词汇作为“情绪信息”的代表,将媒体内容转化为n维向量。为了准确地提取文字内容中的心理学词汇,本研究构建了一个的汉语财经心理学词典,也称为“汉语财经情感词典”。截至2015年12月底,该词典总计包含情感词汇3280个,其中积极词汇1390个,消极词汇1890个。可以预见,汉语财经情感词典的公开问世对行为金融学研究、证券市场的媒体效应研究有着重要意义。第二、媒体信息与资产价格之问的复杂关系分析。目前,研究媒体内容与资产价格关系的模型主要有三类:统计学的变量模型、计量经济学的线性回归模型和人工智能领域的数据挖掘模型。变量模型着眼于媒体内容与资产价格之间的相关性,计量模型关注两者之间的因果性,数据挖掘模型注重两者之间的复杂非线性关系。随着网络社会的发展,媒体信息复杂性增加,专注复杂非线性关系的数据挖掘模型具有明显的优势。因此,本研究提出了“基于媒体感知的关联分析模型”,即"Media-Aware Quantitative Technology",简称"MAQT"。支持向量回归(SVR)是MAQT的分析核心,MAQT以向量化的媒体信息作为输入,以信息发布后的股价为输出,试图捕捉媒体信息与未来股价之间的复杂非线性关系。MAQT从复杂关系角度研究了媒体信息对资产价格的影响,是对统计学模型和计量回归模型的有益补充。基于2011年的股价数据、财经新闻数据和论坛股吧数据,MAQT对媒体信息与信息发布26分钟之后的股价拟合程度最好。因此,26分钟可以看作媒体信息对股价影响力度最大的时间点。第三、以MAQT为基础的证券投资策略。本文对MAQT的预测敏感性进行了深入分析,探讨了MAQT对不同媒体内容、不同行业、不同特性的公司的分析效果。在此基础上,本文构建了“条件MAQT策略”。基于2011年的股价数据,模拟投资结果显示“条件MAQT策略”可以取得300%以上的投资收益,远高于其它传统投资策略。第四、利用媒体操纵市场的监管。随着网络的发展,媒体(新闻、分析师报告、财经论坛等)的影响力空前强大。一些不法分子利用媒体故意散布、夸大利空信息,打压股价,同时完成空头交易获利。为了及时发现此类不法行为,本研究提出了监控媒体悲观情绪的思路。此外,本文也从法律角度探讨了利用媒体操纵市场的监管措施。