【摘 要】
:
自证券市场诞生以来,股票市场的高收益性吸引着大量投资者进行投资,然而其背后的高风险性使得投资者急切需要一种能够对股票市场进行有效预测的方法。因此对于股票市场的预测历来是一个热点问题。传统的股票市场预测研究使用将股票交易是产生的历史数据为变量进行建模分析,而行为金融学理论的发展使得研究者们通过分析投资者情绪也可以预测股票市场,本文将两者进行结合,展开研究。首先,本文将通过网络爬虫技术获得的投资者评论
论文部分内容阅读
自证券市场诞生以来,股票市场的高收益性吸引着大量投资者进行投资,然而其背后的高风险性使得投资者急切需要一种能够对股票市场进行有效预测的方法。因此对于股票市场的预测历来是一个热点问题。传统的股票市场预测研究使用将股票交易是产生的历史数据为变量进行建模分析,而行为金融学理论的发展使得研究者们通过分析投资者情绪也可以预测股票市场,本文将两者进行结合,展开研究。首先,本文将通过网络爬虫技术获得的投资者评论文本数据进行数据清洗,采用word2vec模型进行文本数据向量化表示,并对现今主要的几种情感分析方法进行比较分析,建立基于Stacking算法的情感分析模型,将投资者评论数据进行分析构建投资者情绪特征。其次选取股票交易数据指标,例如股价、交易量等,在对投资者情绪特征与股价之间的因果分析进行Granger检验分析,验证投资者情绪的确能够影响股价的走势。最后本文建立融合投资者情绪特征的SA-SVR模型、SA-BP模型、SA-LSTM模型,以及建立未融合投资者情绪特征的SVR模型、BP模型与LSTM模型,分别从短期、中期、长期三种时间跨度去检验模型预测结果的精确性以及稳定性。本文的实证对象是上证综合指数,实验结果表明,在对投资者评论文本数据进行情感分类中,基于Stacking算法的情感分析模型的性能较好,其召回率为0.81,精确率为0.79,表明基于Stacking算法的情感分析模型能够准确的判断文本数据的情感倾向,并提取投资者情绪特征。同时在对股指进行预测的实验中,融合投资者情绪特征的三类模型性能优于未融合投资者情绪特征的三类模型,验证投资者情绪特征有利于对股票市场的预测研究。同时SA-LSTM模型的预测性能在6中模型中最强,短期预测的MAPE值为0.0092,中期预测的MAPE值为0.0129,长期预测的MAPE值为0.0087。研究发现在对上证综合指数收盘价的预测中,SA-LSTM提取了投资者情绪特征和指数交易指标中的信息量对股指收盘价进行有效预测。
其他文献
现阶段我国的商品出口额在国际市场中位列首位,据中国统计年鉴的数据显示,我国在2021年商品对外出口数额为21.73万亿元,同比增长21.2%。但我国出口贸易在快速发展的同时,其局限性也日益显现,出口商品附加值较低、科技含量不高、利润创造能力有限,整体呈现大而不强的局面,这已严重阻碍了我国从世界大国向世界强国的转变。随着我国进入高质量发展阶段,科技进步已成为促进我国经济发展的关键,高技术产业由于技术
长江经济带囊括11省市,所占面积约为205万平方公里,同时该区域的人口数量和生产总值均超过全国的40%,是中国的国家重要战略发展区域。与此同时,由于长江经济带中各地区之间的各种生产要素等方面存在一定程度的差距,因此长江经济带各地区的发展存在不平衡的现象。其中,长江经济带共包含8个连片特困地区,地理位置偏远、环境恶劣、基础设施薄弱、少数民族聚集,所占的连片特困地区是中国现有集中连片特困地区的50%以
解决我国收入差距扩大、社会阶级固化等问题,构建更加公平合理化的收入分配体系,首要任务就是降低不合理的不平等对我国收入不平等的影响。本研究以机会不平等为切入点,采用2015-2017年中国综合社会调查(CGSS)数据,基于“环境——努力”二元理论分析框架,区分环境因素和努力因素对我国收入的影响。首先,运用条件推断树方法,识别出环境因素对不同出生年代的个体收入不平等的影响路径;然后基于条件推断树研究基
为解决信用卡违约风险预警存在的违约用户识别不足问题,本文构建了基于Stacking集成的信用卡违约分类模型,能够帮助银行提前识别和预判违约用户。针对现有算法特征代价敏感随机森林(FCS-RF)和双重代价敏感森林(DCS-RF)中的缺陷,提出了改进版代价敏感随机森林的分类算法。其中包括在特征选择阶段利用随机森林的袋外数据和G-mean值生成代价矩阵并引入到属性分裂的计算中;在集成投票阶段筛掉表现较差
贫困问题是困扰各国发展的尖锐问题之一。我国在一代又一代共产党人的不懈努力之下,历经七十多年,终于完成了人类有史至今最为艰难的减贫进程,实现了消除绝对贫困的远大目标,为我国实现社会主义现代化夯实基础,为世界各国提供消除绝对贫困的优秀模板。然而,我们必须要认识到绝对贫困的全面消除不是扶贫事业的终点,进入后扶贫时代我们将要面对更加严峻和复杂的相对贫困问题。相比于绝对贫困,相对贫困呈现出显著的波动性和区域
2020年,新冠疫情在全球范围内爆发,经济因此严重受挫。为恢复经济,以美国为代表的西方国家大量放出流动性。自2020年3月,美国公布了一系列经济刺激计划,极易引致全球通货膨胀。因此,为防止通货膨胀现象,对物价水平进行前瞻性预测具有重要意义。物价指数不仅是监测宏观经济的重要指标之一,更关系着城乡居民的日常生活,以及国民经济与社会的稳定健康发展。作为衡量通货膨胀的重要指标,居民消费价格指数(CPI)与
<正>人们经常食用快餐和加工过的高热量、高脂肪、高盐食品,使慢性病发生率呈年轻化上升趋势,死亡率飞速上涨。防控慢性病是全球公共卫生攻坚战的关注点。慢性病发生危险因素很多,其中不合理的饮食模式,尤其是营养过剩或营养不均衡,是许多疾病发展的源头。
鱼类是水生态系统中的重要群落,生境特征则会影响鱼类的群落结构﹒因此,鱼类群落特征是反映流域生态系统状态的关键指标﹒异龙湖是我国典型的高原浅水湖泊,为了解其鱼类群落结构和多样性特征,研究小组分别于2021年3月(枯水期)和10月初(丰水期)开展了2次鱼类资源调查﹒研究结果表明:2次采样共检出鱼类5科10种,其中杂食性鱼类是异龙湖鱼类的主要功能群;其多样性指数H’为0.5~1.5,均匀度指数J’>0.
目的 探讨健脾化湿汤联合地中海饮食对非酒精性脂肪性肝病患者肝功能指标和证候积分的影响研究。方法 选择2019年2月至2021年7月非酒精性脂肪性肝病患者75例为对象,随机数字表法分为2组。对照组(37例)予以健脾化湿汤治疗,观察组(38例)在其基础上联合给予地中海饮食。比较2组患者治疗前和治疗28 d后的肝功能指标[天冬氨酸转氨酶(AST)、丙氨酸转氨酶(ALT)]及证候积分水平。结果 治疗后28
制造业是我国国民经济发展的主体,是我国生产力水平的重要体现。2010年,我国成为世界第一的制造大国,但目前我国制造业的发展仍有短板,需要进一步地改善。近年来,随着资源和环境问题的突出,劳动力等要素成本不断上涨,投资和出口速度明显降低,我国制造业发展面临着严峻挑战,现有的模式难以发展,制造业转型升级刻不容缓。外商直接投资是推进制造业转型升级重要动力因素之一,合理地利用外商投资是推进产业升级的重要渠道