论文部分内容阅读
摘要:本文以1990年至2017年的上证指数作为分析对象,利用深度学习中的LSTM模型,以keras平台作为工具,以Python3.5作为开发环境,建立六层神经网络,对上证指数进行预测,得出了一般情况下增加次迭次数能够提高网络预测效果的结论。
关键词:上证指数;LSTM
中图分类号: F830.91 文献识别码:A 文章编号:1001-828X(2017)013-0-01
1943年,心理学家W·Mcculloch和数理逻辑学家W·Pitts在分析、总结神经元基本特性的基础上首先提出神经元的数学模型。此模型沿用至今,并且直接影响着这一领域研究的进展。因而,他们两人可称为人工神经网络研究的先驱。50年代末,F·Rosenblatt设计制作了“感知机”,它是一种多层的神经网络。这项工作首次把人工神经网络的研究从理论探讨付诸工程实践。当时,世界上许多实验室仿效制作感知机,分别应用于文字识别、声音识别、声纳信号识别以及学习记忆问题的研究。M.Minsky等仔细分析了以感知器为代表的神经网络系统的功能及局限后,于1969年出版了《Perceptron》一书,指出感知器不能解决高阶谓词问题。他们的论点极大地影响了神经网络的研究。人工神经网络研究陷入低潮。后来人工神经网络几经沉浮hiton等,2006年2012年,多伦多大学的 Geoff Hiton利用深度学习的新技术,带领团队实现了85%的图像识别准确率。开创了机器学习的新纪元。从此深度学习开始从学术界走向了工业界,掀起了改变世界的序幕。
LSTM(Long Short-Term Memory,LSTM)是一种时间递归神经网络,LSTM的结构 由Jürgen Schmidhuber在1997年首次提出。借助遗忘门、记忆们的精妙设计结构,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。
本文的研究数据为上证1990年12月29日到2017年5月2日的日线数据。共4172根。采用了keras平台,后端采用Tensorflow引擎。Tensorflow是一个符号主义的张量操作框架,由谷歌公司开发研制。对金融时序数据分析采用的至强处理器,16G内存。同时为了加速处理金融数据的能力,利用NVIDA显卡的GPU提升算法性能,整个算法的软件环境是在Python3.5上搭建的利用GPU的Tensorflow环境,以前90%的数据为训练数据,以后10%的数据为预测数据。
首先将上证指数进行归一化处理,使用的函數是g(x)=(f(x)/f(0)-1).处理后的数据进行输入keras进行计算。本次实验采用的keras网络架构如下:
包括两个Lstm层和四个隐层,每50个为一个输入序列,输入的数据结构为(4122,50,1),第二层节点为150个神经元,每个隐层的神经元为50个,在不同的迭代次数下,得到如图所示结果:(蓝色为预测曲线)
迭代200次的结果如上图所示,仍然在100个数据点后丧失了预测能力。
迭代500次后的结果如图所示,效果较前两次好转很多,具有一定的预测能力。根据上述实验,建立了一个粗略预测上证指数的Lstm模型,具有一定的预测能力,在多次迭代后能够大概预测股指走向。
参考文献:
[1]曾志平,萧海东,张新鹏.基于DBN的金融时序数据建模与决策[J].计算机技术与发展,2017,4:1-5.
[2]陈曲.浅析在线逆向拍卖[J].现代工业经济和信息化,2015(21).
[3]孙小军,张银利.股票-债券投资组合问题的数学模型及算法[J].系统工程理论与实践,2015,35(6):1433-1439.
关键词:上证指数;LSTM
中图分类号: F830.91 文献识别码:A 文章编号:1001-828X(2017)013-0-01
1943年,心理学家W·Mcculloch和数理逻辑学家W·Pitts在分析、总结神经元基本特性的基础上首先提出神经元的数学模型。此模型沿用至今,并且直接影响着这一领域研究的进展。因而,他们两人可称为人工神经网络研究的先驱。50年代末,F·Rosenblatt设计制作了“感知机”,它是一种多层的神经网络。这项工作首次把人工神经网络的研究从理论探讨付诸工程实践。当时,世界上许多实验室仿效制作感知机,分别应用于文字识别、声音识别、声纳信号识别以及学习记忆问题的研究。M.Minsky等仔细分析了以感知器为代表的神经网络系统的功能及局限后,于1969年出版了《Perceptron》一书,指出感知器不能解决高阶谓词问题。他们的论点极大地影响了神经网络的研究。人工神经网络研究陷入低潮。后来人工神经网络几经沉浮hiton等,2006年2012年,多伦多大学的 Geoff Hiton利用深度学习的新技术,带领团队实现了85%的图像识别准确率。开创了机器学习的新纪元。从此深度学习开始从学术界走向了工业界,掀起了改变世界的序幕。
LSTM(Long Short-Term Memory,LSTM)是一种时间递归神经网络,LSTM的结构 由Jürgen Schmidhuber在1997年首次提出。借助遗忘门、记忆们的精妙设计结构,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。
本文的研究数据为上证1990年12月29日到2017年5月2日的日线数据。共4172根。采用了keras平台,后端采用Tensorflow引擎。Tensorflow是一个符号主义的张量操作框架,由谷歌公司开发研制。对金融时序数据分析采用的至强处理器,16G内存。同时为了加速处理金融数据的能力,利用NVIDA显卡的GPU提升算法性能,整个算法的软件环境是在Python3.5上搭建的利用GPU的Tensorflow环境,以前90%的数据为训练数据,以后10%的数据为预测数据。
首先将上证指数进行归一化处理,使用的函數是g(x)=(f(x)/f(0)-1).处理后的数据进行输入keras进行计算。本次实验采用的keras网络架构如下:
包括两个Lstm层和四个隐层,每50个为一个输入序列,输入的数据结构为(4122,50,1),第二层节点为150个神经元,每个隐层的神经元为50个,在不同的迭代次数下,得到如图所示结果:(蓝色为预测曲线)
迭代200次的结果如上图所示,仍然在100个数据点后丧失了预测能力。
迭代500次后的结果如图所示,效果较前两次好转很多,具有一定的预测能力。根据上述实验,建立了一个粗略预测上证指数的Lstm模型,具有一定的预测能力,在多次迭代后能够大概预测股指走向。
参考文献:
[1]曾志平,萧海东,张新鹏.基于DBN的金融时序数据建模与决策[J].计算机技术与发展,2017,4:1-5.
[2]陈曲.浅析在线逆向拍卖[J].现代工业经济和信息化,2015(21).
[3]孙小军,张银利.股票-债券投资组合问题的数学模型及算法[J].系统工程理论与实践,2015,35(6):1433-1439.