论文部分内容阅读
摘要:在量化金融领域中,如何对股票价格进行准确的预测,成为当前研究的重要问题。LSTM网络算法的出现,较好地解决了股票价格预测的复杂序列化数据学习问题。但是,当前研究结果表明,若是单一采用LSTM算法仍然存在预测不平衡、局部极值不准确等问题。GA(遗传算法)的解释在当前金融界中尚没有一定准确定论,但是其在解决调参问题上有着突出效用。在构建新型股票价格预测模型时,首先可以采用LST神经网络算法对收盘价进行预测,然后采用GA遺传算法保证模型预测的准确性,通过辨别机制,最终获取股票价格涨跌信号。基于此,文章针对现有LSTM模型的原理及应用进行了综合分析,并突出说明了LSTM-GA在股票价格预测领域中的应用。
关键词:LSTM记忆神经网络;GA遗传算法;股票;价格涨跌预测模型
随着金融市场的发展,股票价格的预测一直以来都受到人们的关注。然后,股票市场受到的因素较多,对其趋势预测的波动性较大,不仅预测算法较为复杂,还会受到现实情况的掣肘,从而导致预测结果不准确。传统股票价格预测技术大致可以分为技术预测和聚类预测两种类型。本文主要是基于技术预测的基础之上,探究当前LSTM长短期记忆神经网络在股票价格预测中的突出效用,然后充分采用ANN(人工神经网络)、时间序列模型、SVM向量机以及技术预测中的随机性算法来优化股票价格涨跌预测模型。
随着当前智能化技术的深入,ANN(人工神经网络)在处理复杂关系问题上面,被证实了有着突出的作用,但是,由于受到网络测试和人工速度的影响,计算效率较为缓慢。此外,由于ANN还存在陷入局部极小值、过渡拟合以及黑盒技术的缺点,并不能直接被用于股票价格涨跌预测之中;SVM支持向量机的特征是在选择过程中不能有效表现出最优的个数特征,这将严重影响到股票价格涨跌模型系统的精准度。当德国Krauss教授将随机森林算法融入到股票预测之中时,股票价格涨跌模型取得了良好的效果。在Fischer等人的研究中,是将任何一种机器学习模型作为随机算法的有力基准,充分采用了GARCH时间序列模型,并将之充分运用到股票价格涨跌算法之中。其主要是假设时间序列值是呈现线性的生成过程,因此,具有一定的局限性。毕竟在股票市场之中,其涨跌特点不可能呈现线性增长,其价格的涨跌是与运营商的政治经济条件和战略主张息息相关。因此,其中GARCH方法中假设金融时间序列将不能使用到LSTM长期记忆神经网络之中,这也让其时间序列算法更加复杂。Fischer等人再次通过LSTM 模型来针对每日股票数据集进行预测,并针对其收盘价格与开盘价格的分析,来预测其价格涨幅的规律。实验结果表明,采用LSTM结合SVM算法对股票价格涨跌得到预测准确率一般处于51%~54%之间,这样的算法虽然比随机算法更加优秀,但是,却无法准确地精算,依然受到局部极值的影响,计算出来的数值也存在精准度不高的情况。而在后来研究者中,有部分研究者对整体模型参数进行了调整,充分结合了多维度数据处理特征样本。本文就是基于这样的情况下,提出基于LSTM长短期记忆神经网络的机器随机算法来预测股票价格涨跌,并在此基础上加入GA基因算法来加以改进,从而提升预测准确性,充分弥补了采用LSTM网络技术的不足。
一、LSTM长短期神经网络技术的原理及应用
LSTM网络技术最早是由Hocketer等人提出来的,2000年,schmiduber等人对其技术进行了改进与提升,并提出了一种适用于连续性预测的遗忘门方法。Grave在之后的树种也提出了对LSTM 的改进方法,并解释了相关的许多问题,进一步推动了LSTM网络在量化金融领域中的应用。
神经LSTM网络的前身是循环神经网络。RNN(循环神经网络)主要是通过内部循环学习序列模式,在其中形成了多个网络回路,能对其参数进行自主学习和对权值进行调整,从而能不断传递相关信息,并通过反向传播来增加链式规则和数据分布。在反向传播过程中,返回的数值将激活sigmoid和tanh函数,当其火花函数呈现最小值或者是梯度消失梯度爆炸等问题的时候,将出现无法避免的数值丢失与预测问。而LSTM网络技术模型的应用,就是为了有效避免这些问题的发生。Hocker等人在充分研究之后,提出了储存单元和数据库的理念,从而让返回的数值能进行长时间储存,并对其信息进行分析,剔除一些不必要的信息。
LSTM网络技术是一种允许神经元替换的方法。LSTM存储单元的具体结构如图1所示。LSTM单元由一个存储单元(Ct)和三个门组成,包括输入门(it)、遗忘门(ft)和输出门(ot)。这样的数据表明,在时间t,χt表示输出数据和ht隐藏位置时,符号“×”表示向量的外积,而“+”符号表示叠加操作。
具体运算公式如下:
ft=σ(Ufχt+Wfht-1+bf)
it=σ(Uiχt+Wiht-1+bi)
ut=tanh(Uuχt+Wuht-1+bu)
Ct=ft*ct-1+it*ut
Ot=σ(UOχt+Woht-1+bo)
ht=ot*tanh(ct)
在此公式中,W、U代表的是矩阵权重,而b代表的是偏移量,σ代表的sigmoid函数,符号*代表的是向量外积。
遗忘门的计算就是将χt,ht-1,bf进行权加和,然后再通过sigmoid函数得到ft(ft∈(0,1)),如式列ft=σ(Ufχt+Wfht-1+bf)。而其中ft表示的是上一个记忆细胞在(Ct-1)中需要被遗忘的信息权重。换句话说,就是通过遗忘门来对上一个记忆细胞中保留的信息量加以控制,同时运用Ct=ft*ct-1+it*ut式子来计算。而其中输出门中的(Ct)则决定了其可以接受到多少量级的记忆细胞信息,用it=σ(Uiχt+Wiht-1+bi)来进行计算。最后将采用Ot=σ(UOχt+Woht-1+bo)输出门来过滤(Ct)。待原来记忆细胞过滤完全之后,将通过ht=ot*tanh(ct)来获得当前ht的状态,最后进行反向传播,而LSTM模型就是由这些储存块相互计算而得出来的。 而(Ct)也是可以用来表示记忆细胞的储存权重,用ut=tanh(Uuχt+Wuht-1+bu)来进行表示,即可以充分利用遗忘门和输入门对原有信息和新增信息进行分别控制,然后依据Ct=ft*ct-1+it*ut式子计算得到当前的记忆细胞(Ct)。
LSTM具有时间序列的概念,因此特别擅长处理序列数据和上下文相关的实际问题。最新的研究也集中在这些优势上。Qin等人利用LSTM对程序错误反馈报告进行分类,根据文本内容确定它们是真正的bug。Huang等人也知道LSTM善于捕捉序列信息,他们提出了一个基于主题信息的双向LSTM(BILSTM)情感分类模型。此外,随着LSTM模型逐渐得到量化金融领域的支持,Nelson等充分利用LSTM网络技术对股票价格涨跌演化进行了预测,并详细分析了其结果。结果表明,在预测近期股票价格是否存在上涨时,其准确率达到了55.9%。
二、LSTM-GA模型在股票价格涨跌预测领域中的应用
(一)LSTM模型在金融领域的展开研究
随着金融领域的发展,逐渐将flex-thee-LSTM模型应用到金融预测之中,其最主要是利用遗算法对初始值进行优化,在预测能力上能比LSTM模型预测更加简单、快捷。通过研究发现,特征样本对模型的新能有着很大的影响,基于此,有科学家提出了基于动态模式分解的股价预测方法,即长时记忆神经网络(DMD-LSTM)。这是一个复杂而相互依赖的系统,采用动态分解算法提取原始股票数据。陈志明等采用线性组合的方法对原始数据进行降噪,然后应用聚类法重新定义特征参数,形成LSTM模型,经验表明,该方法计算成本较低,预测结果在速度和精度上都有很大提高。
(二)股票预测模型总体框架设计
LSTM-GA股票价格涨跌预测模型主要分为LSTM网络和GA基因涨跌算法模块两个部分组成。其中LSTM网络主要是用于模型学习股票历史数据规律,以便能更加科学、准确地预测出股票收盘时得到价格趋势;GA基因涨跌算法模块主要就是将收盘价格数据转化成为涨跌信号。具体设计如图2所示。
(三)LSTM-GA模型的实际应用
在LSTM-GA模型中,经过LSTM网络的学习与预测,研究者将可以得到下一股价收盘时的价格,为了有效将其结果转化成为涨跌信号,首先就要对其工作原理进行一个准确的定义。在此过程之中,以χtrend为涨跌信号,当χtrend的数值为1的时候,则表示股票价格上涨,当χtrend为0的时候,则表示股票价格平稳,当χtrend为-1的时候,则表示股票价格下跌。此主要是在T时刻的时候,若是底盘价格为CT,那么在判断χtrend的时候,要充分结合t时刻在t-Δt时候的收盘价格为Ct-Δt进行比较,以此来决定Δt的数值,其具体公式为:
χ=1,
C
-C>γ
0,-γ≤
C-
C≤γ
-1,
C-
C<-γ
其中,γ就是判断股票价格涨跌的阈值。
从上述的公式中,可以得出,决定股票价格涨跌的关键是Δt,γ,其不能影响了最后结果的关键性,更可以将复杂的涨跌因子简化,从而达到优化涨跌趋势的合理范围股票市场中,能准确找到代表Δt,γ的数值,让χtrend的判断尽量准确就是确定股票价格涨跌的关键。而这样的优点就是可以尽可能忽略股票价格的小幅度涨跌,能充分缓解滞后的问题。
经过后续的实验研究,为了更加精确的给出χtrend的涨跌信号判断,再次将目标函数定在了精准率的计算之中。本次实验主要就是以获得股票世行收盘价的数据来作为参考,并与预测计算得出的涨跌信号进行对比,具体公式如下:
Precision=
其中,χtrue-trend表示股票市场收盘时的真实价格涨跌情况,χpredict-trend则是经过LSTM-GA模型预测出来的股票价格涨跌情况,Precision则是表示精准率。
三、结语
股票价格涨跌情况的预测一直以来都是金融领域的核心问题,为了解决实际问题,研究人员逐渐开始应用人工智能技术,通过其学习模式来提高股票价格涨跌情况的判断。借鉴之前研究成果,充分运用LSTM神经网络技术构建股票涨跌的神经网络模型。再结合实际应用场景,结合LSTM模型和GA基因算法,来提高股票上涨和下跌的预。但是,在LSTM模型预测中虽然对股票价格小幅度波动方面有着较为准确的预测,但是,结合了GA基因算法的LSTM模型,将更加准确地预测整个股票市场价格的涨跌情况。
由此可见,在未来的研究之中,采用人工智能学习模型来完善LSTM模型将是研究的重点,其不仅可以对最终接个进行有效的预测,更主要是受到市场波动影响较小。假若在模型之中,将股票成交量、最高价格、最低价格等参数充分调动起来,将进一步提升预测效果。从理论上来看,本次方法是可行的,但是,需要相关研究人员进一步研究与探索。当然,此次研究成果也具有一定局限性,只能预测下一股票收盘时的价格涨跌情况,只能作为有限投资的基准。希望在未来股票价格涨跌预测发展中,能研究出更加详细、长久的模型算法。
参考文献:
[1]钱赟.基于主成分分析与序列到序列学习模型的股票收盤价格预测[D].上海:上海师范大学,2020.
[2]王姿.基于LightGBM算法的股指涨跌预测方案[D].上海:上海师范大学,2020.
[3]郜星军.基于神经网络的股票预测模型[D].南宁:广西大学,2019.
[4]张春雨.基于深度学习模型的证券价格预测实证研究[D].太原:山西大学,2018.
(作者:兰州工业学院)
关键词:LSTM记忆神经网络;GA遗传算法;股票;价格涨跌预测模型
随着金融市场的发展,股票价格的预测一直以来都受到人们的关注。然后,股票市场受到的因素较多,对其趋势预测的波动性较大,不仅预测算法较为复杂,还会受到现实情况的掣肘,从而导致预测结果不准确。传统股票价格预测技术大致可以分为技术预测和聚类预测两种类型。本文主要是基于技术预测的基础之上,探究当前LSTM长短期记忆神经网络在股票价格预测中的突出效用,然后充分采用ANN(人工神经网络)、时间序列模型、SVM向量机以及技术预测中的随机性算法来优化股票价格涨跌预测模型。
随着当前智能化技术的深入,ANN(人工神经网络)在处理复杂关系问题上面,被证实了有着突出的作用,但是,由于受到网络测试和人工速度的影响,计算效率较为缓慢。此外,由于ANN还存在陷入局部极小值、过渡拟合以及黑盒技术的缺点,并不能直接被用于股票价格涨跌预测之中;SVM支持向量机的特征是在选择过程中不能有效表现出最优的个数特征,这将严重影响到股票价格涨跌模型系统的精准度。当德国Krauss教授将随机森林算法融入到股票预测之中时,股票价格涨跌模型取得了良好的效果。在Fischer等人的研究中,是将任何一种机器学习模型作为随机算法的有力基准,充分采用了GARCH时间序列模型,并将之充分运用到股票价格涨跌算法之中。其主要是假设时间序列值是呈现线性的生成过程,因此,具有一定的局限性。毕竟在股票市场之中,其涨跌特点不可能呈现线性增长,其价格的涨跌是与运营商的政治经济条件和战略主张息息相关。因此,其中GARCH方法中假设金融时间序列将不能使用到LSTM长期记忆神经网络之中,这也让其时间序列算法更加复杂。Fischer等人再次通过LSTM 模型来针对每日股票数据集进行预测,并针对其收盘价格与开盘价格的分析,来预测其价格涨幅的规律。实验结果表明,采用LSTM结合SVM算法对股票价格涨跌得到预测准确率一般处于51%~54%之间,这样的算法虽然比随机算法更加优秀,但是,却无法准确地精算,依然受到局部极值的影响,计算出来的数值也存在精准度不高的情况。而在后来研究者中,有部分研究者对整体模型参数进行了调整,充分结合了多维度数据处理特征样本。本文就是基于这样的情况下,提出基于LSTM长短期记忆神经网络的机器随机算法来预测股票价格涨跌,并在此基础上加入GA基因算法来加以改进,从而提升预测准确性,充分弥补了采用LSTM网络技术的不足。
一、LSTM长短期神经网络技术的原理及应用
LSTM网络技术最早是由Hocketer等人提出来的,2000年,schmiduber等人对其技术进行了改进与提升,并提出了一种适用于连续性预测的遗忘门方法。Grave在之后的树种也提出了对LSTM 的改进方法,并解释了相关的许多问题,进一步推动了LSTM网络在量化金融领域中的应用。
神经LSTM网络的前身是循环神经网络。RNN(循环神经网络)主要是通过内部循环学习序列模式,在其中形成了多个网络回路,能对其参数进行自主学习和对权值进行调整,从而能不断传递相关信息,并通过反向传播来增加链式规则和数据分布。在反向传播过程中,返回的数值将激活sigmoid和tanh函数,当其火花函数呈现最小值或者是梯度消失梯度爆炸等问题的时候,将出现无法避免的数值丢失与预测问。而LSTM网络技术模型的应用,就是为了有效避免这些问题的发生。Hocker等人在充分研究之后,提出了储存单元和数据库的理念,从而让返回的数值能进行长时间储存,并对其信息进行分析,剔除一些不必要的信息。
LSTM网络技术是一种允许神经元替换的方法。LSTM存储单元的具体结构如图1所示。LSTM单元由一个存储单元(Ct)和三个门组成,包括输入门(it)、遗忘门(ft)和输出门(ot)。这样的数据表明,在时间t,χt表示输出数据和ht隐藏位置时,符号“×”表示向量的外积,而“+”符号表示叠加操作。
具体运算公式如下:
ft=σ(Ufχt+Wfht-1+bf)
it=σ(Uiχt+Wiht-1+bi)
ut=tanh(Uuχt+Wuht-1+bu)
Ct=ft*ct-1+it*ut
Ot=σ(UOχt+Woht-1+bo)
ht=ot*tanh(ct)
在此公式中,W、U代表的是矩阵权重,而b代表的是偏移量,σ代表的sigmoid函数,符号*代表的是向量外积。
遗忘门的计算就是将χt,ht-1,bf进行权加和,然后再通过sigmoid函数得到ft(ft∈(0,1)),如式列ft=σ(Ufχt+Wfht-1+bf)。而其中ft表示的是上一个记忆细胞在(Ct-1)中需要被遗忘的信息权重。换句话说,就是通过遗忘门来对上一个记忆细胞中保留的信息量加以控制,同时运用Ct=ft*ct-1+it*ut式子来计算。而其中输出门中的(Ct)则决定了其可以接受到多少量级的记忆细胞信息,用it=σ(Uiχt+Wiht-1+bi)来进行计算。最后将采用Ot=σ(UOχt+Woht-1+bo)输出门来过滤(Ct)。待原来记忆细胞过滤完全之后,将通过ht=ot*tanh(ct)来获得当前ht的状态,最后进行反向传播,而LSTM模型就是由这些储存块相互计算而得出来的。 而(Ct)也是可以用来表示记忆细胞的储存权重,用ut=tanh(Uuχt+Wuht-1+bu)来进行表示,即可以充分利用遗忘门和输入门对原有信息和新增信息进行分别控制,然后依据Ct=ft*ct-1+it*ut式子计算得到当前的记忆细胞(Ct)。
LSTM具有时间序列的概念,因此特别擅长处理序列数据和上下文相关的实际问题。最新的研究也集中在这些优势上。Qin等人利用LSTM对程序错误反馈报告进行分类,根据文本内容确定它们是真正的bug。Huang等人也知道LSTM善于捕捉序列信息,他们提出了一个基于主题信息的双向LSTM(BILSTM)情感分类模型。此外,随着LSTM模型逐渐得到量化金融领域的支持,Nelson等充分利用LSTM网络技术对股票价格涨跌演化进行了预测,并详细分析了其结果。结果表明,在预测近期股票价格是否存在上涨时,其准确率达到了55.9%。
二、LSTM-GA模型在股票价格涨跌预测领域中的应用
(一)LSTM模型在金融领域的展开研究
随着金融领域的发展,逐渐将flex-thee-LSTM模型应用到金融预测之中,其最主要是利用遗算法对初始值进行优化,在预测能力上能比LSTM模型预测更加简单、快捷。通过研究发现,特征样本对模型的新能有着很大的影响,基于此,有科学家提出了基于动态模式分解的股价预测方法,即长时记忆神经网络(DMD-LSTM)。这是一个复杂而相互依赖的系统,采用动态分解算法提取原始股票数据。陈志明等采用线性组合的方法对原始数据进行降噪,然后应用聚类法重新定义特征参数,形成LSTM模型,经验表明,该方法计算成本较低,预测结果在速度和精度上都有很大提高。
(二)股票预测模型总体框架设计
LSTM-GA股票价格涨跌预测模型主要分为LSTM网络和GA基因涨跌算法模块两个部分组成。其中LSTM网络主要是用于模型学习股票历史数据规律,以便能更加科学、准确地预测出股票收盘时得到价格趋势;GA基因涨跌算法模块主要就是将收盘价格数据转化成为涨跌信号。具体设计如图2所示。
(三)LSTM-GA模型的实际应用
在LSTM-GA模型中,经过LSTM网络的学习与预测,研究者将可以得到下一股价收盘时的价格,为了有效将其结果转化成为涨跌信号,首先就要对其工作原理进行一个准确的定义。在此过程之中,以χtrend为涨跌信号,当χtrend的数值为1的时候,则表示股票价格上涨,当χtrend为0的时候,则表示股票价格平稳,当χtrend为-1的时候,则表示股票价格下跌。此主要是在T时刻的时候,若是底盘价格为CT,那么在判断χtrend的时候,要充分结合t时刻在t-Δt时候的收盘价格为Ct-Δt进行比较,以此来决定Δt的数值,其具体公式为:
χ=1,
C
-C>γ
0,-γ≤
C-
C≤γ
-1,
C-
C<-γ
其中,γ就是判断股票价格涨跌的阈值。
从上述的公式中,可以得出,决定股票价格涨跌的关键是Δt,γ,其不能影响了最后结果的关键性,更可以将复杂的涨跌因子简化,从而达到优化涨跌趋势的合理范围股票市场中,能准确找到代表Δt,γ的数值,让χtrend的判断尽量准确就是确定股票价格涨跌的关键。而这样的优点就是可以尽可能忽略股票价格的小幅度涨跌,能充分缓解滞后的问题。
经过后续的实验研究,为了更加精确的给出χtrend的涨跌信号判断,再次将目标函数定在了精准率的计算之中。本次实验主要就是以获得股票世行收盘价的数据来作为参考,并与预测计算得出的涨跌信号进行对比,具体公式如下:
Precision=
其中,χtrue-trend表示股票市场收盘时的真实价格涨跌情况,χpredict-trend则是经过LSTM-GA模型预测出来的股票价格涨跌情况,Precision则是表示精准率。
三、结语
股票价格涨跌情况的预测一直以来都是金融领域的核心问题,为了解决实际问题,研究人员逐渐开始应用人工智能技术,通过其学习模式来提高股票价格涨跌情况的判断。借鉴之前研究成果,充分运用LSTM神经网络技术构建股票涨跌的神经网络模型。再结合实际应用场景,结合LSTM模型和GA基因算法,来提高股票上涨和下跌的预。但是,在LSTM模型预测中虽然对股票价格小幅度波动方面有着较为准确的预测,但是,结合了GA基因算法的LSTM模型,将更加准确地预测整个股票市场价格的涨跌情况。
由此可见,在未来的研究之中,采用人工智能学习模型来完善LSTM模型将是研究的重点,其不仅可以对最终接个进行有效的预测,更主要是受到市场波动影响较小。假若在模型之中,将股票成交量、最高价格、最低价格等参数充分调动起来,将进一步提升预测效果。从理论上来看,本次方法是可行的,但是,需要相关研究人员进一步研究与探索。当然,此次研究成果也具有一定局限性,只能预测下一股票收盘时的价格涨跌情况,只能作为有限投资的基准。希望在未来股票价格涨跌预测发展中,能研究出更加详细、长久的模型算法。
参考文献:
[1]钱赟.基于主成分分析与序列到序列学习模型的股票收盤价格预测[D].上海:上海师范大学,2020.
[2]王姿.基于LightGBM算法的股指涨跌预测方案[D].上海:上海师范大学,2020.
[3]郜星军.基于神经网络的股票预测模型[D].南宁:广西大学,2019.
[4]张春雨.基于深度学习模型的证券价格预测实证研究[D].太原:山西大学,2018.
(作者:兰州工业学院)