基于GNN模型的股票波动趋势预测研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:wjs9988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国已成为全球第二大经济体,而股票市场则是我国经济十分重要的环节,改革开放进入二十一世纪以来,我国的股票市场不断发展与完善,股票趋势预测的话题备受关注,若能准确地判断股票在未来的波动趋势,这将产生巨大的价值,带来收益的同时也能规避风险。计算机技术的发展,使得使用神经网络技术对股票趋势进行预测成为热门研究领域,如使用长短期记忆神经网络模型、循环神经网络模型、支持向量机模型等,基于股票的历史数据,对股票的未来进行预测。基于目前的股票预测研究现状,大量的模型都是从时间序列的角度分析股票的特征,本文从数据之间的关联的角度出发,提出使用图神经网络对股票波动趋势进行预测,在利用数据的时间序列特征的同时,挖掘数据之间的联系,使用图神经网络模型进行训练,做出预测。本文的主要工作如下:1、介绍了股票分析相关理论知识,包括股票预测的方法,股票基础交易数据以及股票技术指标。阐述图神经网络相关理论知识,包括图论与图神经网络模型两部分。图论包括图的基本定义、在计算机中的储存方法以及图谱论,图神经网络模型的部分则是从谱域与空域的角度出发,介绍图神经网络的工作原理与经典的图神经网络模型。2、阐述本文所使用的MTGNN模型。MTGNN模型的优势在于能够根据已有的时间序列数据构建图结构数据,使得时间序列数据能在图神经网络中训练,同时在训练过程中,MTGNN模型能不断地更新图结构,增强预测的效果。该模型主要分为三层:图学习层、图卷积模块、时间卷积模块。其中图学习层利用时间序列数据构建图结构数据,图卷积模块融合节点之间的信息,挖掘节点之间的关联,时间卷积模块则用来获取数据的精确的时间特征。3、选取了贵州茅台、中信证券、招商银行、美的集团4支股票近十年来的基础交易数据,包括开盘价、收盘价、最高价、最低价、成交量5项,开展特征工程,基于收盘价,建立了SMA、WMA、MOM、RSI、WILLR、ROC、CMO共六项指标,并进行主成分分析。基于4支股票数据,优化模型损失函数,探究模型超参数、学习率与丢失率的最优设置方案。并针对每支股票,设计基础交易特征模型与技术指标混合特征模型两个实验,以RAE、RSE作为评估指标,实验结果表明MTGNN模型能取得较好的准确率,且技术指标混合特征模型能提升预测的效果。最后对模型超参数的影响进行分析,并进行消融实验,探究各个模块对模型性能的影响。
其他文献
数据规模在持续爆炸式不断扩大。IDC(International Data Corporation)对全球数据规模进行的预测显示,截止到2025年,全球数据量可达175ZB。社会各界、各方团体对于数据的使用和认知不断加深,人们愈发重视数据本身的经济学特征。中国是数据大国,随着数据要素化政策的出台,各地数据交易机构建立并试运行,国内数据市场初具规模,其健康发展需要坚实的理论研究作为支撑。但是数据资产
学位
在信息过载的当前互联网环境下,用户获取有价值信息的信息成本越来越高,为了解决这一问题,推荐系统(Recommendation System,RS)应运而生。推荐系统从用户项目交互信息或静态特征中推断用户偏好,并进一步推荐用户可能感兴趣的项目,以帮助用户做出更有效的决策,有很大的应用价值。而在某些场景中,用户信息是匿名的,推荐系统只能根据用户点击行为序列来学习用户的兴趣表示,该类情况被归为推荐系统的
学位
在大数据环境下,每个行业都高度重视从海量用户数据中挖掘其背后的隐藏信息和价值,然而这些信息存在数据本身的隐蔽性,另外业务人员无法给数据人员清晰地表达自己的意图,导致难以从结构化数据中最大限度的获取到用户的喜好特征。因此直接通过自然语言在数据库查询数据,搭建数据库的自然语言交互平台也受到越来越多企业和研究学者的关注。NL2SQL是自然语言查询数据背后的核心技术,而NL2SQL中自然语言和SQL语言本
学位
随着我国经济社会的不断发展,工业化水平和人民的生活质量不断提高,与此同时工业化给生态环境带来了较大的负面影响。十九大报告指出,当前我国社会的主要矛盾是人民日益增长的美好生活需要与不平衡不充分的发展之间的矛盾。生态文明建设的速度与居民对美好、健康生活的需求增长不相匹配。近年来雾霾天气在我国一些城市中时有发生,随着《大气污染防治行动计划》等治理措施的提出,空气质量有所改善,但是要全面解决空气污染问题,
学位
随着医学的发展,疾病领域越来越细分,医生临床实践的差异化也越来越明显,由于医生临床实践过程中的医疗数据结构和表达的不统一,致使医疗机构、科室之间的信息交换、共享、整合和利用无法达成,影响了精准的疾病防治。因此术语标准化应运而生,不仅解决了信息表达的不一致性问题,而且实现了语义层面上的信息共享。然而,临床医学术语数量巨大以及表达方式多种多样,并且传统的基于人工规则的匹配方式成本高、效率低,亟需一种智
学位
近年投资基金逐渐成为大众化话题,搜集查询基金信息的需求不断增加。人们可通过搜索引擎或基金网站了解基金信息,但有时需要对相关基金信息进行比较,对感兴趣的基金进一步了解其相关信息,比如要了解某基金的基金经理还管理了哪些基金。此类需求涉及问答系统中的多跳问答问题,在知识图谱中表现为问题主实体到答案实体经过的关系路径不止一条。基于知识图谱的问答在处理单跳问题方面已能达到较高精度,目前难点和研究方向集中在复
学位
随着网络的高速发展,用户在网络上的足迹记录越来越多。为了提高用户的体验,满足用户的个性化需求,个性化推荐系统被提出来。传统的推荐系统都是在单域中进行推荐,会面临冷启动与数据稀疏的问题。跨域推荐的提出,实现了可借助其他域中的数据为用户进行推荐,解决了单域推荐系统中存在的冷启动与数据稀疏问题。但随着用户在网络上的交互越来越频繁,越来越广泛,用户在不同域之间的兴趣会产生影响,这时候,跨域推荐不仅仅是作为
学位
随着互联网技术的发展与普及,网络上的信息爆炸式地增长。与日俱增的信息在丰富了网络上信息量的同时,也加大了人们从互联网获取目标信息的难度。智能问答系统作为一种新型的信息服务方式,能够理解自然语言问题并回答,可以更方便、直接地帮用户获取信息。表格具有数据量丰富和结构明确的特点,在网络技术发展的过程中成为了主流的数据载体。为了方便用户从表格中获取信息,表格智能问答——即以表格作为智能问答的答案来源,成为
学位
随着5G时代的到来与数字化社会的快速发展,人们的生活越来越依赖网络。与此同时,方便人们表达自我与网络社交的社交媒体平台也飞速发展。越来越多的用户进入社交媒体平台,留下了丰富的个人动态、个人信息等数据,这些数据都是用户自主产生,具有极大的真实性与可靠性。通过分析用户在社交媒体平台产生的数据,可以做到尽可能全面、准确地描绘用户画像。用户基本属性和用户兴趣是社交媒体用户画像重要的组成部分,对于社交平台运
学位
流行性感冒极易于每年秋冬季在人群中流行传播,严重影响人们的生命安全和生活节奏,流感疫苗可以帮助人体提高免疫力,有效保护人体避免感染流感病毒。目前各国公共卫生机构的一项重要任务就是制定各种流感疫苗接种政策,从而提高流感疫苗在人群中的普及率,保障人民的生命健康安全。由于个人对流感疫苗的了解程度较低或其他原因,有不少人对接种流感疫苗持犹豫或拒绝的态度,这对流感疫苗的接种工作造成了一定的困难。因此需要分析
学位