基于LSTM-GA的股票价格涨跌预测模型

来源 :中国集体经济 | 被引量 : 0次 | 上传用户:gaolch002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   摘要:在量化金融领域中,如何对股票价格进行准确的预测,成为当前研究的重要问题。LSTM网络算法的出现,较好地解决了股票价格预测的复杂序列化数据学习问题。但是,当前研究结果表明,若是单一采用LSTM算法仍然存在预测不平衡、局部极值不准确等问题。GA(遗传算法)的解释在当前金融界中尚没有一定准确定论,但是其在解决调参问题上有着突出效用。在构建新型股票价格预测模型时,首先可以采用LST神经网络算法对收盘价进行预测,然后采用GA遺传算法保证模型预测的准确性,通过辨别机制,最终获取股票价格涨跌信号。基于此,文章针对现有LSTM模型的原理及应用进行了综合分析,并突出说明了LSTM-GA在股票价格预测领域中的应用。
   关键词:LSTM记忆神经网络;GA遗传算法;股票;价格涨跌预测模型
   随着金融市场的发展,股票价格的预测一直以来都受到人们的关注。然后,股票市场受到的因素较多,对其趋势预测的波动性较大,不仅预测算法较为复杂,还会受到现实情况的掣肘,从而导致预测结果不准确。传统股票价格预测技术大致可以分为技术预测和聚类预测两种类型。本文主要是基于技术预测的基础之上,探究当前LSTM长短期记忆神经网络在股票价格预测中的突出效用,然后充分采用ANN(人工神经网络)、时间序列模型、SVM向量机以及技术预测中的随机性算法来优化股票价格涨跌预测模型。
   随着当前智能化技术的深入,ANN(人工神经网络)在处理复杂关系问题上面,被证实了有着突出的作用,但是,由于受到网络测试和人工速度的影响,计算效率较为缓慢。此外,由于ANN还存在陷入局部极小值、过渡拟合以及黑盒技术的缺点,并不能直接被用于股票价格涨跌预测之中;SVM支持向量机的特征是在选择过程中不能有效表现出最优的个数特征,这将严重影响到股票价格涨跌模型系统的精准度。当德国Krauss教授将随机森林算法融入到股票预测之中时,股票价格涨跌模型取得了良好的效果。在Fischer等人的研究中,是将任何一种机器学习模型作为随机算法的有力基准,充分采用了GARCH时间序列模型,并将之充分运用到股票价格涨跌算法之中。其主要是假设时间序列值是呈现线性的生成过程,因此,具有一定的局限性。毕竟在股票市场之中,其涨跌特点不可能呈现线性增长,其价格的涨跌是与运营商的政治经济条件和战略主张息息相关。因此,其中GARCH方法中假设金融时间序列将不能使用到LSTM长期记忆神经网络之中,这也让其时间序列算法更加复杂。Fischer等人再次通过LSTM 模型来针对每日股票数据集进行预测,并针对其收盘价格与开盘价格的分析,来预测其价格涨幅的规律。实验结果表明,采用LSTM结合SVM算法对股票价格涨跌得到预测准确率一般处于51%~54%之间,这样的算法虽然比随机算法更加优秀,但是,却无法准确地精算,依然受到局部极值的影响,计算出来的数值也存在精准度不高的情况。而在后来研究者中,有部分研究者对整体模型参数进行了调整,充分结合了多维度数据处理特征样本。本文就是基于这样的情况下,提出基于LSTM长短期记忆神经网络的机器随机算法来预测股票价格涨跌,并在此基础上加入GA基因算法来加以改进,从而提升预测准确性,充分弥补了采用LSTM网络技术的不足。
   一、LSTM长短期神经网络技术的原理及应用
   LSTM网络技术最早是由Hocketer等人提出来的,2000年,schmiduber等人对其技术进行了改进与提升,并提出了一种适用于连续性预测的遗忘门方法。Grave在之后的树种也提出了对LSTM 的改进方法,并解释了相关的许多问题,进一步推动了LSTM网络在量化金融领域中的应用。
   神经LSTM网络的前身是循环神经网络。RNN(循环神经网络)主要是通过内部循环学习序列模式,在其中形成了多个网络回路,能对其参数进行自主学习和对权值进行调整,从而能不断传递相关信息,并通过反向传播来增加链式规则和数据分布。在反向传播过程中,返回的数值将激活sigmoid和tanh函数,当其火花函数呈现最小值或者是梯度消失梯度爆炸等问题的时候,将出现无法避免的数值丢失与预测问。而LSTM网络技术模型的应用,就是为了有效避免这些问题的发生。Hocker等人在充分研究之后,提出了储存单元和数据库的理念,从而让返回的数值能进行长时间储存,并对其信息进行分析,剔除一些不必要的信息。
   LSTM网络技术是一种允许神经元替换的方法。LSTM存储单元的具体结构如图1所示。LSTM单元由一个存储单元(Ct)和三个门组成,包括输入门(it)、遗忘门(ft)和输出门(ot)。这样的数据表明,在时间t,χt表示输出数据和ht隐藏位置时,符号“×”表示向量的外积,而“+”符号表示叠加操作。
   具体运算公式如下:
   ft=σ(Ufχt+Wfht-1+bf)
   it=σ(Uiχt+Wiht-1+bi)
   ut=tanh(Uuχt+Wuht-1+bu)
   Ct=ft*ct-1+it*ut
   Ot=σ(UOχt+Woht-1+bo)
   ht=ot*tanh(ct)
   在此公式中,W、U代表的是矩阵权重,而b代表的是偏移量,σ代表的sigmoid函数,符号*代表的是向量外积。
   遗忘门的计算就是将χt,ht-1,bf进行权加和,然后再通过sigmoid函数得到ft(ft∈(0,1)),如式列ft=σ(Ufχt+Wfht-1+bf)。而其中ft表示的是上一个记忆细胞在(Ct-1)中需要被遗忘的信息权重。换句话说,就是通过遗忘门来对上一个记忆细胞中保留的信息量加以控制,同时运用Ct=ft*ct-1+it*ut式子来计算。而其中输出门中的(Ct)则决定了其可以接受到多少量级的记忆细胞信息,用it=σ(Uiχt+Wiht-1+bi)来进行计算。最后将采用Ot=σ(UOχt+Woht-1+bo)输出门来过滤(Ct)。待原来记忆细胞过滤完全之后,将通过ht=ot*tanh(ct)来获得当前ht的状态,最后进行反向传播,而LSTM模型就是由这些储存块相互计算而得出来的。    而(Ct)也是可以用来表示记忆细胞的储存权重,用ut=tanh(Uuχt+Wuht-1+bu)来进行表示,即可以充分利用遗忘门和输入门对原有信息和新增信息进行分别控制,然后依据Ct=ft*ct-1+it*ut式子计算得到当前的记忆细胞(Ct)。
   LSTM具有时间序列的概念,因此特别擅长处理序列数据和上下文相关的实际问题。最新的研究也集中在这些优势上。Qin等人利用LSTM对程序错误反馈报告进行分类,根据文本内容确定它们是真正的bug。Huang等人也知道LSTM善于捕捉序列信息,他们提出了一个基于主题信息的双向LSTM(BILSTM)情感分类模型。此外,随着LSTM模型逐渐得到量化金融领域的支持,Nelson等充分利用LSTM网络技术对股票价格涨跌演化进行了预测,并详细分析了其结果。结果表明,在预测近期股票价格是否存在上涨时,其准确率达到了55.9%。
   二、LSTM-GA模型在股票价格涨跌预测领域中的应用
   (一)LSTM模型在金融领域的展开研究
   随着金融领域的发展,逐渐将flex-thee-LSTM模型应用到金融预测之中,其最主要是利用遗算法对初始值进行优化,在预测能力上能比LSTM模型预测更加简单、快捷。通过研究发现,特征样本对模型的新能有着很大的影响,基于此,有科学家提出了基于动态模式分解的股价预测方法,即长时记忆神经网络(DMD-LSTM)。这是一个复杂而相互依赖的系统,采用动态分解算法提取原始股票数据。陈志明等采用线性组合的方法对原始数据进行降噪,然后应用聚类法重新定义特征参数,形成LSTM模型,经验表明,该方法计算成本较低,预测结果在速度和精度上都有很大提高。
   (二)股票预测模型总体框架设计
   LSTM-GA股票价格涨跌预测模型主要分为LSTM网络和GA基因涨跌算法模块两个部分组成。其中LSTM网络主要是用于模型学习股票历史数据规律,以便能更加科学、准确地预测出股票收盘时得到价格趋势;GA基因涨跌算法模块主要就是将收盘价格数据转化成为涨跌信号。具体设计如图2所示。
   (三)LSTM-GA模型的实际应用
   在LSTM-GA模型中,经过LSTM网络的学习与预测,研究者将可以得到下一股价收盘时的价格,为了有效将其结果转化成为涨跌信号,首先就要对其工作原理进行一个准确的定义。在此过程之中,以χtrend为涨跌信号,当χtrend的数值为1的时候,则表示股票价格上涨,当χtrend为0的时候,则表示股票价格平稳,当χtrend为-1的时候,则表示股票价格下跌。此主要是在T时刻的时候,若是底盘价格为CT,那么在判断χtrend的时候,要充分结合t时刻在t-Δt时候的收盘价格为Ct-Δt进行比较,以此来决定Δt的数值,其具体公式为:
   χ=1,
  C
  -C>γ
  0,-γ≤
  C-
  C≤γ
  -1,
  C-
  C<-γ
   其中,γ就是判断股票价格涨跌的阈值。
   从上述的公式中,可以得出,决定股票价格涨跌的关键是Δt,γ,其不能影响了最后结果的关键性,更可以将复杂的涨跌因子简化,从而达到优化涨跌趋势的合理范围股票市场中,能准确找到代表Δt,γ的数值,让χtrend的判断尽量准确就是确定股票价格涨跌的关键。而这样的优点就是可以尽可能忽略股票价格的小幅度涨跌,能充分缓解滞后的问题。
   经过后续的实验研究,为了更加精确的给出χtrend的涨跌信号判断,再次将目标函数定在了精准率的计算之中。本次实验主要就是以获得股票世行收盘价的数据来作为参考,并与预测计算得出的涨跌信号进行对比,具体公式如下:
   Precision=
   其中,χtrue-trend表示股票市场收盘时的真实价格涨跌情况,χpredict-trend则是经过LSTM-GA模型预测出来的股票价格涨跌情况,Precision则是表示精准率。
   三、结语
   股票价格涨跌情况的预测一直以来都是金融领域的核心问题,为了解决实际问题,研究人员逐渐开始应用人工智能技术,通过其学习模式来提高股票价格涨跌情况的判断。借鉴之前研究成果,充分运用LSTM神经网络技术构建股票涨跌的神经网络模型。再结合实际应用场景,结合LSTM模型和GA基因算法,来提高股票上涨和下跌的预。但是,在LSTM模型预测中虽然对股票价格小幅度波动方面有着较为准确的预测,但是,结合了GA基因算法的LSTM模型,将更加准确地预测整个股票市场价格的涨跌情况。
   由此可见,在未来的研究之中,采用人工智能学习模型来完善LSTM模型将是研究的重点,其不仅可以对最终接个进行有效的预测,更主要是受到市场波动影响较小。假若在模型之中,将股票成交量、最高价格、最低价格等参数充分调动起来,将进一步提升预测效果。从理论上来看,本次方法是可行的,但是,需要相关研究人员进一步研究与探索。当然,此次研究成果也具有一定局限性,只能预测下一股票收盘时的价格涨跌情况,只能作为有限投资的基准。希望在未来股票价格涨跌预测发展中,能研究出更加详细、长久的模型算法。
   参考文献:
   [1]钱赟.基于主成分分析与序列到序列学习模型的股票收盤价格预测[D].上海:上海师范大学,2020.
   [2]王姿.基于LightGBM算法的股指涨跌预测方案[D].上海:上海师范大学,2020.
   [3]郜星军.基于神经网络的股票预测模型[D].南宁:广西大学,2019.
   [4]张春雨.基于深度学习模型的证券价格预测实证研究[D].太原:山西大学,2018.
   (作者:兰州工业学院)
其他文献
摘要:现金股利政策对投资者保护与公司发展有重要意义。现金股利政策既受外部环境因素也受公司内部环境的影响,为研究现金股利政策是否受党组织参与公司治理的影响,文章搜集了2015~2018年我国A股国有上市公司的数据。通过实证分析的方法研究发现党组织参与公司治理与现金股利支付水平显著正相关,这一结论丰富了现金股利政策影响因素的研究。   关键词:党组织;公司治理;现金股利;企业管理   一、引言  
摘要:在互联网时代,经济快速发展,消费者的支付手段、支付途径也发生了巨大的变化,各种新兴支付也快速崛起。大学生作为当代社会的一个重要群体,拥有良好的记账习惯和理财能力是必不可缺的技能。文章将构建一个基于大学生个人记账理财需求而开发的综合性记账理财服务平台,以帮助广大的大学生群体实现自有资金的合理规划使用。   关键词:记账;理财;大学生   一、记账理财服务发展背景   在手机支付的快节奏生
摘要:国有企业是我国国民经济的中坚力量,财务管理作为经营管理中的一项重要内容,其管理水平的高低会直接影响国有企业的发展,同时也关系到国家经济的发展。当前形势下,为适应市场经济的飞速发展,应加快企业业财融合的脚步,发挥财务与业务的协同作用,助力企业财务管理水平的提高,从而实现国有企业高质量的发展。文章首先介绍了推进业财融合的重要性,通过对国有企业业财融合中存在的主要问题进行分析研究,并提出针对性建议
摘要:文章通过对股指期货不同限制条件下进行对比,分析股指期货对股票市场的价格影响内在原理,通过实证分析选取沪深300股指期货及对应的日数据,经过计量模型验证股指期货价格波动对股票市场的重要引导作用。实证结果表示,沪深300股指期货价格发现功能与股市限制程度有一定直接联系,而受到中金对股指期货限制的调整措施,交易比较活跃的股指期货能够更直接引导股票市场的价格,稳定股市,减少股市波动。以实证验证结果完
摘要:银行从本质上来说是经营风险的行业。因此,银行至关重要的一项工作便是抵御风险。21世纪以来,作为我国商业银行用来抵御风险的最后一道屏障,资本的作用受到了高度的重视。我国各大商业银行在风险管理实践过程中,借鉴西方商业银行经济资本管理的经验,逐渐摸索形成了一种新的风险管理手段——经济资本管理。经济资本管理作为银行业未来风险和价值管理领域的核心手段,逐渐成为各大商业银行在风险管理方面采用的现代化理论
摘要:进行农村振兴战略的实施可以助推“三农”工作纵深化发展,对于完善我国现代化经济体系也有重要作用,作为当前社会治理格局建设下的一项基础方略,农村振兴战略逐步推进了各类金融产品服务的出现,提供了更为广阔的金融需求,助力现代化农村建设,帮助实现农村资源的优化配置。文章通过研究农村金融领域的问题主要分析借助农村金融提高乡村发展水平的初步效果,并根据当前发展现状提出针对性对策建议。   关键词:农村金
摘要:文章从制造业服务化的基本内涵出发,用区域投入产出表以及世界投入产出数据库分别考察和测算了广东制造业服务化的现状及其存在的主要问题,进而提出了相关政策建议。   关键词:广东;制造业服务化;产业价值链   深入研究广东制造业服务化的发展现状,准确把握广东制造业服务化在全国所处的位置,然后指定具有针对性的政策措施,无论是对于进一步推进广东对外开放还是提升省内制造业竞争力水平都有重要的理论意义
摘要:在我国经济发展水平不断提升的背景下,我国经济发展也从以往的高速发展阶段逐步转变为高质量发展趋势,我国煤炭行业伴随宏观经济调控也随之进入高质量发展阶段。煤炭产业作为促进我国经济建设发展的重要组成部分,为了能够积极面对来自新时代的挑战,需要对当前形势进行分析,逐步转变媒体企业管理者的经营管理意识。文章对煤炭销售工作开展期间存在的问题进行探究,同时对于煤炭工作优化策略进行分析,旨在全面提升煤炭企业
摘要:21世纪初期,国内兴起了诸如淘宝、京东等网络购物平台。随后几年,网络购物的快速发展已经深刻影响人们的消费习惯,甚至出现以往实体店销售所没有的消费热点和消费事件。与传统的销售模式不同,网络销售具有周期短、货物种类多、销售环节更少、更新速度快等优点,这使得线上销售在很短的时间内快速抢占了市场份额。但是网络购物也有自身的缺点,例如购物体验差,假货横行、钓鱼网站和网络诈骗日渐增多等。随着消费热点和购
摘要:垃圾分类政策在住宿业的实施发展是一个必然的趋势,垃圾分类政策在近几年逐渐完善,住宿业中的细则标准仍需不断探索加以明确。随着垃圾分类政策在成都住宿业的实施,成都住宿业开始面临诸多挑战。文章从成都住宿业在垃圾分类政策下的现状,面临的问题出发,提出垃圾分类政策下成都住宿业有关对策。   关键词:垃圾分类政策;垃圾处理标准体系;“政府+市场+公众”   随着上海垃圾分类政策的推出,全国各地也陆续