【摘 要】
:
如今,基于数理统计模型的量化投资技术得到了充分的发展和应用,投资者基于此类方法可获得较大回报。机器学习、深度学习算法随着AI时代的到来被应用到各个领域。这些前沿算法可以实时处理海量的数据,模型也能取得不错的拟合效果,同时泛化能力也得到大幅提升。在本论文中,尝试将这些前沿算法应用到股票市场中,分别采用机器学习中的XGBoost方法与深度学习中的LSTM方法对股票调整收盘价预测,并对拟合效果进行对比。
论文部分内容阅读
如今,基于数理统计模型的量化投资技术得到了充分的发展和应用,投资者基于此类方法可获得较大回报。机器学习、深度学习算法随着AI时代的到来被应用到各个领域。这些前沿算法可以实时处理海量的数据,模型也能取得不错的拟合效果,同时泛化能力也得到大幅提升。在本论文中,尝试将这些前沿算法应用到股票市场中,分别采用机器学习中的XGBoost方法与深度学习中的LSTM方法对股票调整收盘价预测,并对拟合效果进行对比。首先,本文介绍了机器学习和深度学习的概念、应用、模型的优化方法,接下来介绍了数据的来源与特征工程的概念。实证目标是利用前N天的数据(即预测范围大于等于1)对Vanguard Total Stock Market ETF(VTI)每天的调整收盘价进行预测。文章中用到的的数据是基于VTI的历史价格:自2015.11.25至2018.11.23。其次,基于金融时间序列预测具有不确定性、复杂性与时间记忆性的特点,本文提出了使用机器学习算法的构建的XGBoost模型与使用深度学习算法的构建的长短期记忆神经网络模型,在股票数据中提取特征作为模型的输入,同时将上面两种模型与lastvalue、移动平均法、线性回归方法对比,所选取的对比指标为均方根误差(RMSE)与平均绝对百分比误差(MAPE)。最后,在阐述特征缩放对模型预测结果具有重要性的基础上,把缩放后的序列集合用于模型训练。随后,选用五种算法对验证集进行预测并对比预测成效,结果显示XGBoost具有最好的特征选择与预测成效。
其他文献
为探讨和比较在ε-CL-20 (六硝基六氮杂异伍兹烷)(001)、(110)和(020)晶面上的ε-CL-20/PVA(聚乙烯醇)与ε-CL-20/PEG(聚乙二醇)复合物的稳定性和力学性能,在COMPASS力场下,对ε-CL-2
我是一炼钢厂吊检车间冷冻二班班长,我们全班九人担负着全厂四十台空冷设备的维护和检修工作。去年,厂部要求,全厂所有的空冷设备必须在四月五日前全部调试完毕。二百多台
目的 研究大头金蝇(Chrysomya megacephala)卵不同发育时间的形态变化和基因表达差异规律。方法 从大头金蝇成虫产完卵后,取出卵块,记时为0 h,每隔2 h取卵10枚,直至有幼虫孵出,
德国慕尼黑大学近几年在Klapotke教授带领下一直在寻找新型的高能氧化剂,继之前报道了两类基于羧基二异氰酸酯和二硝基丙二醇的新型高能氧化剂后,近来又通过草酰氯和草酰叠氮化
4月5日(原定发行日)《炎帝陵》 炎帝陵,又称天子坟,在湖南炎陵县(原为酃县)城西南15公里的塘田乡(属炎陵县塘田邮电所辖区,412514)。炎帝即神农氏,为我国传说中的古帝,史称其
我们修炉二车间十五组,有9名组员。过去我们组的综合考核名次处于工段中下游水平,组长为小组的名次低而发愁,工段为小组的工作上不去而抱怨,组员们抱着"混一天算二个半天"的
目的对犬恶丝虫酪蛋白激酶2β亚基(Csnk2b)部分基因片段进行克隆、原核表达及免疫反应性分析。方法根据犬恶丝虫cDNA文库中筛选出的Csnk2b部分基因片段设计引物,以含有插入Csnk2