基于社交平台舆论和历史价格的证券市场趋势预测方法

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:long96169
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘和自然语言处理技术的发展使得研究社交平台数据与金融证券市场波动之间的关系成为可能,人工智能领域的自然语言处理、深度学习技术和金融领域的融合是大势所趋,证券市场走势预测任务就是其中的研究热门之一。但是,影响证券市场价格涨跌的因素众多,再加上其波动性较高,使得预测证券市场趋势是一个难题,而已有的研究表明社交平台舆论数据在一定程度上影响或反映着证券市场运动,针对这一问题,本文提出了一种基于舆论文本嵌入和历史价格的证券市场走势预测方法。首先,与传统的文本嵌入方法不同,本文提出的文本嵌入方法不仅仅考虑到文本的语义特征和情感因素,也将舆论文本特有的交互结构特性考虑在内,使得生成的表示舆论文本的嵌入向量能够包含更有效的信息。具体来说,本文设计了一个舆论节点模型,首先通过构建舆论节点网络来描述舆论数据中关于语义和交互特性的潜在连接,再利用图嵌入算法从图中得到文本表示,此外,模型还通过BERT补充了舆论文本表示的情感属性。为了更好地利用得到的舆论文本表示,本文结合注意力机制和LSTM设计了一个深度预测模型,将舆论节点算法得到的舆论文本表示和经过处理的历史交易信息一起输入到构建的深度学习模型中进行证券市场趋势预测。在推特数据集和雅虎财经讨论板数据集上的实验结果表明,本文提出的基于社交平台舆论和历史证券信息的深度预测模型能够超越常用的预测模型,达到较好的短时证券市场趋势预测效果。此外,在算法研究的基础上,本文提供了一个可视化的交互式证券市场趋势预测平台,这个平台集成了本文提出的算法,便于用户查看目标证券并进行短时证券市场走势预测,为用户的投资行为提供参考意见。
其他文献
多路径效应降低了伪距和载波相位观测的精度,严重影响了复杂环境下GNSS精密单点定位(Precise Point Positioning,PPP)的收敛性能。近年来,基于时空重复性的多路径改正方法由于其在复杂度及实时性等方面的突出优点,成为学界和业界的研究热点。与传统的时间重复性方法相比,空间重复性方法具有算法简单、易于实施等优势。作为典型的空间重复性改正方法,多路径半天球图(Multipath H
高送转方案曾经是我国A股市场上市公司热衷采用的利润分配方式。上市公司能够通过高送转方案快速扩大股本、增加股票的流动性。然而,高送转概念却被恶意炒作,成为内部人进行利益输送的方式,不少“低股价、低业绩、高股本”的企业跟风实施高送转方案,损害中小投资者利益,引起监管部门的重视。2018年,沪深交易所发布高送转新指引,明确了不同板块高送转的定义,且对高送转企业作出进一步要求。这一举措令不少上市公司想借助
命名实体识别是指在文本中识别出包含特定意义的命名实体。在互联网时代,以微博为代表的社交媒体中每时每刻都在产生着大量的文本数据,对这些文本进行命名实体识别可以获得相当大的应用价值。目前,针对中文微博文本的命名实体识别仍面临着一些困难:1.微博文本存在着用词不规范、口语化严重等问题,对这些不规范文本的识别准确度仍然很低。2.与英文相比,中文单词之间缺乏明显的边界信息,因此中文命名实体识别通常使用基于字
粒径小于5 mm的塑料称为微塑料(MPs)。它们在大气、水、土壤中累积,污染环境,危害生物和人体健康。目前关于降解MPs的研究集中在生物法和光催化法。生物法对环境污染小,但是它依赖微生物的种类,反应条件严格。光催化法的成本低,但是反应过程中氧化剂的损失会限制反应速率。三维电化学反应器(3DER)是在二维电化学的基础上,填充材料而构成。由于其氧化能力高,能源利用率高,能耗低等优点,三维电化学技术被广
英雄烈士为中华民族伟大事业和民族独立解放作出重大贡献,理应受后代敬仰。但是,近年来,社会上出现了很多贬损抹黑英雄烈士形象,歪曲、否定他们英雄事迹和精神的行为,不仅侵害了英雄烈士的名誉、荣誉等人格利益,更损害了其人格利益中融入的社会公共利益。针对这些行为,我国在制定《民法总则》时增加了第185条规定,并颁布了《英雄烈士保护法》,以弥补对英雄烈士人格利益保护的不足,对尊崇英烈,弘扬英烈精神和社会主义核
贫困是全世界范围内的命题,消除贫困是全世界各国政府都在为之努力的一件事。中国作为世界上最大的发展中国家,存在着贫困人口基数大、分布范围广、贫困程度不一等现状,我国也是全世界脱贫减贫工作最大的推动者,经过几十年不懈的努力和积极的探索,走出了一条有中国特色的脱贫减贫道路。本文以C县省派驻村“第一书记”工作为研究对象,通过访谈和走访的方式了解他们在开展“抓党建促脱贫”工作中取得的成绩和开展作中遇到的问题
软件可信性是软件工程一个重要研究领域,而软件可信性度量是可信软件一个研究热点,其目的是对软件可信性进行量化评估,保障软件产品的质量。起初的软件可信度量大多是将软件作为整体,通过研究影响软件可信性的属性量化评估整个软件可信度。随着软件技术的不断发展,软件规模越来越大,基于组件的软件开发技术已成为软件开发的主流技术。本文着重关注组件的可信性量化模型,将组件分为关键组件和非关键组件,在此基础上建立一种基
随着大数据、5G、边缘计算等新技术的迅猛发展,各行业对数字化转型的需求更加迫切,云服务正从互联网行业普及到政府、制造、金融、零售、交通、教育等领域。面对严峻的云服务市场竞争形势,对于以盈利为目标的云服务提供商来说,其亟需解决的关键问题是如何设计有效的调度算法使云服务利润最大化。现有的云服务利润优化研究工作一般只讨论云服务运营商这一层面,而忽略了对云用户这一层面的分析。因此虽然当前研究可能会在短期内
基于深度神经网络的分类模型在许多领域的任务中效果显著。然而,对于在某任务上训练好的模型,如果使其对一些新类别的数据进行学习,此模型对旧类别数据的识别能力会大幅下降,即模型产生灾难性遗忘。类增量学习旨在克服灾难性遗忘,使分类模型可以动态地对新类别数据进行学习,前提是训练时不使用或者只使用远少于旧数据总量的少量旧类别数据,并且训练后的模型能够为目前见过的所有类别进行有效分类。为了使深度模型能够适应类增
学位