基于二维GoogLeNet-LSTM模型对股票涨跌的预测

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:wzmuyelan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票市场是资本市场的重要组成部分,也是量化投资的重要研究方向。随着我国经济的不断腾飞,人们的投资理念在不断提高,对于股票趋势预测的研究课题越来越受到广大学者的重视。从初期通过简单的线性模型,例如:ARIMA模型、GARCH模型等时间序列模型对股票数据进行预测,到通过非线性模型,例如:SVM模型、RF模型、NBM模型等机器学习模型对股票数据进行研究,模型的复杂度和预测效果都在不断上升。最近几年,随着Alpha Go和Chat GPT等深度学习模型在人工智能领域的突破性发展和对人们社会生活的实质性改变,神经网络模型越来越受到广大学者的关注。神经网络逐渐应用于社会生活的各行各业,量化投资学者也开始尝试着将ANN人工神经网络、BP神经网络、RNN循环神经网络以及CNN卷积神经网络等模型应用于股票预测的研究中,并取得了不错的效果。基于上述研究背景,本文通过选取上证50指数作为研究对象,采用CNNLSTM模型对股票的涨跌进行预测。对于数据的选取,本文在通过Tushare、Bao Stock等python的API获取上证50指数的基本盘指标数据(open、high、low、close、volume等)的基础上,还通过Ta-Lib库和聚宽(Join Quant)平台引入了EMA、DEMA、MACD、ADX、OBV、CCI、RSI、ROC、ATR、Alpha002、Alpha003、Alpha006、Alpha009和Alpha070共14个新指标,并对数据进行缺失值和异常值处理、相关性分析、PCA降维、数据标准化和数据集划分等数据预处理工作。将预处理后的数据传入CNN-LSTM模型中,这里CNN模型尝试使用了二维(Conv2d)的Goog Le Net卷积神经网络,并将预测结果与一维CNN(Conv1d)模型、基本盘指标数据、ARIMA模型、SVM模型、RF模型、LSTM模型的预测结果进行比较,论证说明二维Goog Le Net-LSTM模型对于股票涨跌具有更为优秀的分类能力和预测效果。本文的实证分析结果表明:(1)使用二维(Conv2d)的Goog Le Net卷积神经网络的预测效果要优于一维CNN(Conv1d)模型;(2)通过增加更多因子可以使CNN-LSTM模型提取出更多数据特征,模型的预测效果也明显高于只包含基本盘指标的数据;(3)通过使用CNN-LSTM模型预测股票涨跌的效果要优于ARIMA模型、SVM模型、RF模型和LSTM模型。本文论证了使用二维Goog Le Net-LSTM模型能更有效的提升模型的准确率,对神经网络在股票研究领域有指导性意义。论证了通过引入更多因子和提升模型复杂度用以挖掘数据信息可以有效提升股票预测准确率,对于股票的预测和趋势性研究具有现实意义。
其他文献
癌症一直是人类公共健康领域的主要威胁之一,是全球第二大死因,每年全世界约有上千万人死于癌症。本文基于癌症基因组图谱计划(TCGA)数据库中的泛癌基因组数据,使用多种统计分析方法评估了ARHGEF2基因在泛癌中的影响和作用,探究并证明了其潜在的治疗靶点功能。本文首先对基因表达数据进行对数标准化,使用Wilcoxon秩和检验分析了目标基因在正常样本和肿瘤样本中的表达差异,发现目标基因在29种肿瘤样本中
学位
急性肾损伤是一种常见的临床综合征,通常指肾功能在7天之内突然下降,临床表现为血清肌酐的升高或尿量的减少,从而导致肾脏过滤和排泄身体代谢废物的功能丧失。急性肾损伤的发病速度快,死亡率高达20%-60%,约有10-15%的住院患者和5 0%以上的重症监护病房患者会受到急性肾损伤的困扰。本文考虑了临床医学中较为常用的13项指标,预测急性肾损伤患者住院期间死亡率。具体的来说,本文总结了优秀LSTM模型变体
学位
本文主要研究空间转录组数据的降维问题。空间转录组技术可以在测量基因表达的同时保留了细胞在组织上的空间位置信息,弥补了单细胞转录组技术因细胞解离而导致的细胞位置信息丢失。与单细胞数据类似,空间转录组数据同样具有高维、复杂、高噪声和高稀疏性等特点,在下游分析之前有必要对空间转录组数据进行降维。但由于空间转录组数据中邻近位点的表达存在高度相关性,许多经典的降维方法(如主成分分析等)无法有效利用。因此,我
学位
随着金融市场的稳健发展,上海证券交易所于2015年2月9日在证监会的批示下推出上证50ETF期权,其以境内首支交易型开放式指数基金上证50ETF为标的资产,所属欧式期权类别,是投资交易和学术研究的主流期权之一。作为国内首只场内期权,上证50ETF期权推动着期权交易量稳步上升,也带动郑州商品交易所等交易所推出各式商品期权,吸引越来越多投资者活跃在期权市场,期权价格是投资者所关心的投资成本,所以期权定
学位
<正>本刊讯近日,2023年度江苏省轻工协会科学技术奖名单公布,洋河《苏派白酒生态智能酿造关键技术研究与应用》《一种提高浓香型原酒总酸含量及复合感的方法》分别荣获2023年度江苏省轻工协会科学技术进步一等奖、三等奖,《白酒酒糟中功能性物质提取关键技术的研究与应用项目》荣获2023年度江苏省轻工协会科学技术发明三等奖。
期刊
小屏手机因其小巧便携和续航能力强等特点一直备受欢迎。然而,受限于零件配置和生产技术,目前市场上可选的小屏手机种类并不多。因此,各大手机厂商对小屏手机市场份额的竞争异常激烈。与此同时,在线评论数据爆炸式增长,如何有效利用这些数据已成为一个挑战。本文旨在利用大数据分析和文本挖掘技术分析消费者的反馈和评论,帮助商家提高产品和市场竞争力,同时也有助于消费者更好地了解商品情况,优化购买决策。基于此背景,本文
学位
近年来,房地产行业实现了跨越式发展,它对国民经济起到重要支撑作用的同时也带来了一些现实问题。随着房地产行业的快速扩张,日益高涨的房价成为了社会各界的关注热点,我国政府也相继出台了多项政策来对房价进行控制。为了确保宏观政策调控的合理性,需要对房地产行业进行更为科学有效地分析。本文采用中国35个大中城市2007年-2020年的房价及相关数据进行实证分析。首先,建立参数空间面板自回归模型探索房价影响因素
学位
糖尿病是全球最为流行的慢性病之一.根据2021年一份全球糖尿病报告,全球糖尿病患者已达到5.37亿人.我国是糖尿病患者最多的国家,近年来我国成人糖尿病患病率持续上升,过去的10年间患者人数增幅达56%,其中尚未被确诊的患者比例高达51.7%.但由于医疗资源有限等原因,我国对糖尿病高危人群的筛查是远远不够的.而通过机器学习的方法,可以帮助医生快速的对高危人群进行筛查,做到早发现、早干预,可以有效减少
学位
本文介绍了对数正态几何复合分布的定义与性质,给出了复合分布函数的概率分布函数、密度函数、失效率函数、平均剩余寿命和平均失效率函数。由于文中给出的失效率函数、平均失效函数、以及密度函数和平均剩余寿命较为复杂,不能通过对函数求导的方式给出函数的形状特征,故本文主要以图像加证明的方式讲述了复合分布概率密度函数、失效率函数、平均剩余寿命和平均失效率函数的性质。此外,文中给出了高阶矩的存在性的证明。论文在参
学位
顺应经济全球化的发展,未来国家需要的是应用型和全面型的人才,以满足科学技术的发展和应对国际竞争的需要。随着全球化的进程不断推进,多元文化的融合已然成为我国社会文化发展的必然趋势和不争的事实。发展STEAM教育既有利于培养创新性、实践性和全面性的人才,又能促进多元文化的融合。近年来国内相继出台了很多国家性和地方性的政策来促进STEAM教育的本土化发展,希望通过STEAM教育培养学生成为具有科学文化素
学位