【摘 要】
:
上市公司发布的年报是上市公司一年一度的对其报告期内的经营生产概况、财务情况等重要信息进行公开披露的报告,是上市公司信息披露制度的核心部分。随着近十年来自然语言处理技术以及深度学习的快速发展,基于金融文本情感分析的金融分析作为一种主要的技术研究手段,已被广泛的研发并应用到许多实际的投资决策辅助系统中。上市公司年报除了有大量结构化数据以外,还包含着许多的非结构化数据,即文本数据。在分析的过程中不但要分
论文部分内容阅读
上市公司发布的年报是上市公司一年一度的对其报告期内的经营生产概况、财务情况等重要信息进行公开披露的报告,是上市公司信息披露制度的核心部分。随着近十年来自然语言处理技术以及深度学习的快速发展,基于金融文本情感分析的金融分析作为一种主要的技术研究手段,已被广泛的研发并应用到许多实际的投资决策辅助系统中。上市公司年报除了有大量结构化数据以外,还包含着许多的非结构化数据,即文本数据。在分析的过程中不但要分析结构化数据,如财务报表之类的数据,分析这些文本数据也是至关重要的。在研究过程中其具有很高的实际应用价值。且随着中国内地证券市场监管越来越趋于严格,上市公司年度报告的内容也随之越来越真实、格式也越来规范,这也会使得投资者越来越重视年报中所透露出的有关信息。因此,通过自然语言处理来对上市公司年报中的情感倾向进行分析挖掘具有非常重大的意义。本文利用Python的爬虫技术爬取了2012年到2020年A股沪深两市上市的3000余家上市公司的年度报告,累计约合30000篇。研究对象为年报中的管理层经营分析相关文本。本文旨在建立模型对管理层经营分析文字进行情感分析研究,通过爬取年报数据后建立起年报情感数据集后,最终建立一个可以有效分析年报情感倾向的模型。本文的研究内容主要围绕自然语言处理技术展开,通过与现有情感词库对比,在大量的年报中的管理层经营分析相关文本中运用分词和改进的情感共现算法提取和扩充情感词来构建年报情感词库。从年报情感词库中得到词语的情感倾向后,通过本文提出的SEN-TF-IDF算法对年报中包含的情感词加权得出年报的情感倾向,进而建立起年报情感数据集。基于该数据集本文提出了篇章级年报情感分类模型,该模型属于深度学习模型,该模型由Word Embedding层、卷积神经网络和结合注意力机制的双向LSTM层以及全连接层构成。模型结构使用Word2vec词嵌入作为输入,由于年报中句子较长且长短不一,在词嵌入后将其输入到卷积神经网络学习对句子向量进行降维和统一长度,然后将其输入到Bi-LSTM层,Bi-LSTM层能从左右两个方向获取长时序序列间的依赖关系,进而提取文本的全局特征,经结合注意力机制的BiLSTM层输出的融合重要信息权重的向量,最后得到篇章级情感向量,再将其输入到全连接层和Softmax层进行分类。该模型与基线模型相比,取得了更加优秀的分类效果与准确率。最后,利用该模型进行实验后的结果表明,篇章级年报情感分类模型可以较好地对年报进行情感分类,分类结果与人工分类无较大差异,在对行业内年报整体情感进行分类的结果也符合预期。利用模型对2020年年报进行分类后,选取情感值最高的十支个股与最低的利用同一策略进行回测,情感值最高的十支个股预期收益显著高于情感之最高的十支个股,进一步证明了模型的有效性。
其他文献
高度重视党内政治文化建设,是我们党建设发展一以贯之的内在要求,也是我们党作为马克思主义政党区别于其他一切政党的突出优势和显著标志。一段时间以来,面对意识形态领域斗争的复杂形势,面对改革强军、正风肃纪的重大考验,习主席把军队党内政治文化建设作为基础性、灵魂性工程突出出来,不断推动管党治军呈现新气象,展现新风貌。军队党内政治文化产生并服务于党对军队绝对领导的政治和军事活动,是一种标准更高、要求更严、导
党的十八大以来,习近平总书记站在全面建成小康社会、实现中华民族伟大复兴中国梦的战略高度,把“三农”问题摆到治国理政突出位置,提出一系列新思想新观点,作出一系列新决策新部署,形成了习近平新时代“三农”观。习近平新时代“三农”观是习近平新时代中国特色社会主义思想的重要组成部分,为新时代“三农”问题的解决提供了理论遵循和实践指导。习近平新时代“三农”观围绕升级农业、振兴农村、发展农民展开,其理论来源丰富
电脑音乐制作是一项将计算机与音乐艺术相结合的手段,随着社会的发展和人民日益增长的精神文化艺术需求,音乐制作者利用电脑音乐制作已经为我们带来了数量可观、类型繁多的音乐作品。广西隆林县有着丰富的民族民间歌曲素材,通过实地采风取材,本论文以电脑音乐制作结合笔者的作品《五彩漫山》为例,在导师的创编建议基础上,研究使用电脑音乐制作技术对收集到的隆林本地壮族、汉族、苗族、彝族以及仡佬族五个民族的民间歌曲进行全
十八大以来,在党中央、国务院的正确领导下,在全国各族人民的共同努力下,我国农村政治、经济、文化、社会等方面的发展均已取得了阶段性的成果。2020年,我国脱贫攻坚取得了全面胜利,现行标准下9899万农村贫困人口全部脱贫。但是令人遗憾的是,我国乡村治理能力提升却相对缓慢,甚至在很多方面仍然存在较大的提升空间和完善潜力,如过分追求经济指标增长、无法有效满足农村社会需求、制度建设相对迟缓、政府行为不规范、
在“新工科”背景下,为培养综合性、创新型人才,针对食品科学与工程专业“食品化学实验”课程教学中存在的问题,从教学内容、教学方法和考核方式3个方面进行教学改革探索,增加自主设计实验环节,变被动学习为主动实践,细化课程考核评分标准,以期提升教学效果,培养学生的研究与创新能力,促进“新工科”教学的发展。
肿瘤严重威胁着人类的生命健康,并已成为人类面临的主要杀手之一。由于肿瘤的高复发和转移特性,化疗、放疗和手术治疗等传统手段皆存在一定的不足。近年来,基于纳米技术的新型肿瘤治疗手段不断涌现。例如,研究者通过纳米载体材料负载Fe、Cu等过渡态金属离子,催化肿瘤部位高表达的过氧化氢(H2O2),产生剧毒的羟基自由基(·OH),以破坏细胞内蛋白质、脂质或干扰DNA代谢,从而杀死肿瘤细胞,实施化学动力学治疗;
大麦芽具有良好的营养和风味特征,是啤酒生产的主要原料,也被广泛用于其他食品行业。对基础大麦芽和咖啡麦芽的营养成分进行检测和分析,结果表明,基础大麦芽的营养价值更高,特种麦芽的色、香、味方面更突出,结合大麦芽产品的多样性和特点,介绍了大麦芽食品应用的优势和食品工业需求,及大麦芽在食品工业中的应用现状和应用潜力,为大麦芽在食品工业更多领域高值化的应用提供参考。
数字经济迅速发展,带来了市场需求的变化,也为我国数字文化企业带来了新的问题和机遇。江苏省在国家的支持下,不断扩大数字文化产业总体数量,带动相关产业发展。但江苏省数字文化产业领域仍存在数字基础设施建设发展不平衡、创新能力不足、发展环境还需完善、龙头型企业不足等问题。要促进江苏省数字文化产业全面发展,就必须加强数字基础设施建设加大数字文化内容创新力度、完善优化数字文化产业发展环境、培育壮大领军型企业。
本世纪初以来,互联网及高速移动网络提升了中国深化改革中的开放程度,而高速移动网络兴起将互联网融入群体及个人的日常生活中,互联网络成为新型生活必需品之一。当前高校网络意识形态安全面临以下挑战:高校对网络意识形态安全工作的重视度不足、高校教师对学生多元化思想引导待加强、高校意识形态教育方法创新进入瓶颈期、新时代下大学生的思想政治状况错综复杂。随着互联网普及率持续增高,上述挑战产生的弊端使得高校网络意识
自加入WTO以来,我国开放的大门不断敞开,进出口贸易在我国经济发展中扮演着极其重要的作用,出口导向型的经济也使我国成为“世界工厂”,进口竞争水平也在不断提高,这不仅带来了机遇也使我国面临全球企业的竞争压力,因此本文探讨进口竞争会如何影响企业绩效,对提高企业经营绩效和推动经济结构转型具有重要的理论和现实意义。本文使用我国微观制造业企业数据,基于2000-2007年的工业企业数据以及海关数据,实证考察