基于深度学习的新闻文本和股市波动关系探究及预测

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:litian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在金融市场中,波动率不仅是衡量风险的指标,它对衍生品定价和资产配置都至关重要,因而对于波动率的研究一直是金融研究领域当中的较为热门话题。在对波动率的研究上,一些学者采用了文本情感分析的方法,通过词频统计模型探究与波动率的关系。然而,词频统计模型因其无法联系上下语义的局限性,语义捕捉能力较差,降低对波动率的解释效力。此外,而在对波动率预测的研究上,之前的研究集中在对低频收益率数据拟合而成的GARCH类模型,但低频数据的研究已不适用于现如今金融市场的发展需求。目前,对高频波动率的研究已成为学术研究的热点问题,具有一致估计性和无模型性的已实现波动率已成为被广泛接受和认可的真实波动率代理值。基于已实现波动率,可建立HAR类模型对波动率进行拟合和预测。但是,HAR类模型属于线性模型,捕捉非线性特征能力较弱,且局限于股票价格数据,所以波动率的预测还有着一定的提升空间。鉴于此,本文以日内1分钟高频上证指数和新浪财经新闻数据探究以上存在的两个问题。首先,为了量化新闻文本对股票市场的正负冲击性,独立搭建适用于财经新闻样本的BERT模型,将新闻映射为-1到1的冲击性值,经过标签标注和模型训练,预测准确率达到83%,相较于词频统计模型有着更强的泛化能力。之后,将该模型应用于爬虫获取到的40万条新浪财经新闻文本,发现除了“数据”、“疫情”、“国际”以及“市场”,大部分新闻类别均为利好信息多于利空信息。然后,根据冲击性值分新闻类别和正负性色彩,构造了日内新闻指数,将其与股价日内波动做对比,在总体下,两者存在较强的相关关系,同时也发现日内股价波动与新闻负向冲击的相关性比正向冲击更相关,验证了利空信息大于利好信息对股市市场波动的影响;而在分为11个新闻类别下,发现只有“疫情”和“国际”类别的新闻是利好信息对股市影响大于利空信息,说明了在中国控制疫情后股市受到疫情负面影响较为微弱,此外,还发现了央行类别的新闻指数与股市波动关联程度是最高的,说明了我国股市比较容易受到央行政策的影响,这也是与我国股市受到央行监管程度较高的原因相关。正是因为所构造的新闻指数与股价波动存在较为相关的关系,所以本论文最后探究对已实现波动率预测的创新方法。该模型基于前一天交易时间外的新闻指数和HAR类模型预测值,采用深度学习模型框架(LSTM/GRU)构造。该方法不仅考虑到了价格跳跃效应和误差修正,而且还利用新闻文本信息增强对波动率的预测能力。在对比了9种模型预测效果后,发现基于LSTM的该方法预测效果是最优的,预测效果在MAE上可比HAR模型提升6.06%。
其他文献
坚定的理想信念是中国共产党战胜一切风浪考验、永葆旺盛生命力和强大战斗力的重要思想武器,也是党的初心得以传承、使命持续担当的内在文化基因。理想信念建设则是共产党人补足精神之钙、紧握胜利之钥的灵魂工程。十八大以来,面对新时代的历史新境遇,习近平总书记立足推进党的建设新的伟大工程的战略高度,将坚定理想信念宗旨提升为党的建设的根基工程,并围绕共产党人理想信念建设这一时代课题发表了诸多饱含创新性的思想观点,
学位
随着社会经济与城市化的快速发展,建设用地的扩张,生态环境问题日益突出,土地利用方式以及生态环境问题已成为制约城市化与社会经济发展的关键问题,虽然制定一系列限制土地利用方式改变、退耕还林,耕地占补平衡等维护生态环境的措施,但当下土地利用与生态环境协调性不足。在城市化的过程中,不仅要考虑社会经济效益,更要兼顾资源节约型和环境友好型“两型”社会建设理念,实现绿色生态城市建设,在国土空间规划的大背景下,“
学位
由于全球经济形势和信息/电信技术的发展,全球工作、虚拟工作和自我管理团队的出现大大增加了专业工作的复杂性和灵活性。考虑到现代工作的复杂性,自上而下的工作(重新)设计越来越困难,组织更倾向于个体自下而上的工作(重新)设计,鼓励员工发展和主导他们的工作活动。重塑作为一种积极主动的行为方式,能够帮助个体更加高效工作,幸福生活,以应对这个压力日增的社会中可能出现的各种问题。那么重塑的效果到底如何,这一效应
学位
基于TIA15.1中的S7-PLCSIM功能,结合生活中常见的十字路口交通灯现场控制需求,设计了使用MCGS触摸屏和西门子S7-1200组合的工控系统。考虑了工控系统开发前期无实物PLC和触摸屏的场景问题,利用NetToPLCsim搭建起S7-PLCSIM与MCGS的虚拟仿真架构。调试结果显示,该方法稳定可靠,能够为S7-1200PLC与MCGS触摸屏早期联合开发项目提供高效的虚拟仿真技术支持,更
期刊
机器自动解答初等数学算术题具有非常大的挑战性,主要是人类理解数学问题的思维与机器可理解的逻辑表示之间存在很大的语义差距。尽管20世纪60年代就开始了机器解答算术题方面的研究,但其研究结果和人们的预期期望还是存在着很大的差距。以往的研究方法需要过多的人为规则和人工干预,并且应用场景单一,往往只能解决研究者预先设定好的场景下的算术题。近年来,基于深度学习的数学算术题机器解答的研究,又重新获得了很大的发
学位
初中阶段作为毕生发展的一个关键阶段,承担着个体由童年期逐步向成年期发展的过渡作用,青少年期的初中生在生理及认知发展和社会性等方面都会产生巨大的变化。环境和社会适应的好坏会对包括同伴关系、学业成绩、自我认同等在内的整个青少年期的生活与学习产生影响,处理人际关系等社会问题的能力对个体而言显得尤为重要。社会创造性是在社会领域表现出的创造性,体现在个体的日常社会活动和人际交往中,其重要性不言而喻。因此,本
学位
机关事务管理工作高质量推进是我们国家当前焦点工作之一,稳步推进机关事务管理法治化是治理模式迎合新时代、促进机关高效发展的新要求。依法行政有效深化、加快法治政府建设也能从机关事务管理法治化进程中集中体现,机关事务管理法治化是稳步推进依法治国具有实践意义的重要举措。2020年底,中共中央发布的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》与《法治中国建设规划(2020—2
学位
在金融市场定价理论中,资本资产定价模型(CAPM)一直都是起主导作用的资产价格文献。风险与预期收益之间的权衡一直都是金融学中最受关注的问题,近几十年来,左尾风险是否在确定预期回报的横截面方面发挥特殊作用的问题也一直受到金融经济学家的关注。风险规避的投资者要求以更高的预期回报的形式获得更高的报酬,以持有风险更高的金融证券。转换到左尾风险框架,在对预期收益相关高阶矩变量分布不了解的情况下,具有较高左尾
学位
近年来,中国地方政府债务迅速增长,政府债务在补缺口、强基建和促发展等方面发挥了积极的作用,但由于规模增长快,债务风险不断累积,且越来越突出,已成为我国经济可能的“灰犀牛”。与此同时,地方政府债务扩张所产生的巨额资金需求可能会通过金融市场的传导影响公司部门的融资需求。全社会的资金资源在整体上是有限的,当地方政府的融资需求大幅上升以及地方政府的信用较好,银行会偏向选择地方政府,一定程度上挤占原本属于公
学位
代谢组学是生物流体或组织中低分子量代谢物动态变化的量度。代谢组学研究的基本策略为基于高通量分析技术量测的高维数据的获得和基于化学计量学方法的代谢组学数据解析。此类数据通常具有小样本、高维、高噪和易含奇异样本的特性。化学计量学在代谢组学数据解析中的两项主要任务为识别各组之间的代谢差异(即模式识别)并筛选出表征各组之间代谢差异的潜在的重要生物标志物(即变量选择)。近年来,分析技术平台的不断发展导致生成
学位