【摘 要】
:
随着我国经济的迅猛发展以及人民生活水平的不断提高,越来越多人开始投资股票,我国股票市场也逐渐发展壮大。股票市场具有收益高、风险大的特点。如何较为准确的预测股票未来价格,从而降低投资风险、增加投资收益,一直是投资者最为关注的课题。本文将使用数据挖掘中的相关理论模型对上证指数收盘价进行分析并建立预测模型。首先,本文从Choice金融终端爬取上证指数1990年12月19日至2022年5月1日的7696个
论文部分内容阅读
随着我国经济的迅猛发展以及人民生活水平的不断提高,越来越多人开始投资股票,我国股票市场也逐渐发展壮大。股票市场具有收益高、风险大的特点。如何较为准确的预测股票未来价格,从而降低投资风险、增加投资收益,一直是投资者最为关注的课题。本文将使用数据挖掘中的相关理论模型对上证指数收盘价进行分析并建立预测模型。首先,本文从Choice金融终端爬取上证指数1990年12月19日至2022年5月1日的7696个交易日的日数据,并根据爬取的数据,通过一定的数学运算方法得到24个技术指标,将爬取的数据和构建的技术指标合并得到包含1个目标变量和31个特征变量的原始数据集。经过数据清洗后,将数据标准化,分别利用相关系数分析法和嵌入式两种特征选择方法,对指标进行筛选,最终得到包含9个特征变量的上证指数收盘价数据集。其次,针对股票价格预测问题,采用网格搜索和交叉验证法确定模型的参数,分别构建机器学习中的三个单一模型:SVR、Ridge回归和Lasso回归,四个集成模型:RF、XGBoost、AdaBoost和LightGBM,以及深度学习中的单变量LSTM模型和多变量LSTM模型。对比各模型的评价指标值,发现在构建的九个模型中,LightGBM模型的MAE和MSE两个指标值最低,且EVS和R~2两个指标值最高,因此认为LightGBM模型是九个模型中对上证指数收盘价预测效果最好的模型。最后,针对股票价格预测问题,利用Stacking方法构建融合模型。基于第四章构建的九个模型以不同的组合方式,分别构建了15种融合模型。通过比较15种Stacking融合模型的评价指标值发现,以LightGBM、LSTM、AdaBoost模型为初级学习器,SVR为次级学习器的Stacking融合模型对上证指数收盘价的预测效果最好,具有较强的稳健性。将Stacking融合模型与LightGBM模型进行对比发现,其预测效果仍是最优的,并利用该模型给出了2022年5月4日至12月30日共164个交易日的上证指数收盘价的短期预测值,通过计算相对误差,164个样本数据中,79.2%的数据的相对误差低于5%,说明Stacking融合模型对上证指数的预测效果较好。
其他文献
当前"互联网+"技术在不断的创新和发展,国家对"互联网+医疗"已经出台政策支持,本文主要是针对目前"互联网+护理服务"的应用现状,以及当前护士在"互联网+护理服务"中发挥的相关作用进一步的阐述,旨在为护士在"互联网+护理服务"领域发挥的重要作用进一步的分析,为"互联网+医疗"的更好发展提供参考和借鉴。
股票价格预测是投资者获取利益的重要前提,股票价格预测的精确度直接影响获利大小。近年来,基于神经网络的股票价格预测方法已成为主流预测方法和研究热点。已有研究显示考虑市场舆情因素进行股价预测具有更高的精确度。但是市场舆情数据收集困难程度高,对股价影响大的突发舆情发生频率低,难以满足神经网络训练所需的数据量。同时因为神经网络的黑匣子特性,学习到的数据特征和非线性关系不易理解,使得数据发生变化时难以动态选
N-乙酰神经氨酸(Neu Ac),又称燕窝酸或唾液酸,是哺乳动物中发现的唾液酸类化合物中最主要的一种,对于改善大脑发育和认知、增强免疫功能等具有重要作用,已被广泛用作营养化学品和药物中间体。同时,以Neu Ac为合成前体的多种化合物,特别是唾液酸基母乳寡糖,在营养强化剂领域有重要应用。目前,Neu Ac的工业化生产方法主要为提取法和全细胞催化法,存在成本高、污染环境和引入过敏原等固有缺陷。因此开发
2-酮基-L-古龙酸(2-KLG)是大宗发酵产品维生素C的直接前体。当前,2-KLG的工业生产主要采用经典的三菌二步发酵法。该方法是对莱氏法的巨大改进,极大地简化了2-KLG的生产流程,有效的降低了2-KLG的生产成本。但随着合成生物学及代谢工程的迅猛发展,研究者们越来越追求一菌一步的2-KLG生产工艺。一菌一步法取代三菌二步法意味着2-KLG的生产将具有更为稳定的工艺以及更为低廉的生产成本。几十
唾液酸是一组具有9碳骨架的酸性单糖,自然界中发现了50多种结构多样的唾液酸,其中N-乙酰神经氨酸(Neu5Ac)、N-羟乙酰神经氨酸、去氨基神经氨酸和神经氨酸是最常见的唾液酸,广泛存在于哺乳动物细胞和微生物的聚糖中。细胞间通讯、细胞间相互作用、免疫应答、微生物感染等多种生物过程与唾液酸和唾液酸聚糖的结构和表达水平密切相关,因此对其结构鉴定和定量分析具有非常重要的作用。然而,高效阴离子交换色谱、质谱
<正>冻干水果是采用冷冻干燥机将水果里面的水分快速冻结,然后在真空环境下将被冻结的水分升华,即真空冰状脱水,得到干燥的水果,保存了水果原有的色、香、味、营养成分和原有的物料外观,并具有良好的复水性。下面介绍冻干柿子脆片加工技术,供大家参考。
股票市场在国家经济中占据非常重要的地位,近年来基于深度学习的股票预测模型的研究得到了广泛关注,通过对股票数据的技术分析预测未来股票价格走势是众多学者研究的重点。股票数据特征表示的优劣直接影响预测模型的性能,且现有的股票预测模型存在长序列学习能力差,不具备学习前后时间步联系的能力与股票数据重复训练的问题。为此,本文重点对股票数据特征表示方法、股票价格预测方法和股票预测模型预训练展开研究,研究内容如下
股票市场是社会主义市场经济体系的重要组成,股票价格的波动可以反映宏观经济的发展状况。随着市场交易的日常化,股票价格预测逐渐成为当前学界业界共同关注的问题之一。然而,股票价格受着多因素的影响,时刻处于非线性的动态变化之中。若能实现较为精确的预测,将有助于投资者降低投资风险、建立组合投资策略,也将为中国股市的理论研究提供有力参考。因此,如何选择和量化股票价格预测的影响因素、应用何种预测模型,便具有重要
甲烷(CH4)是天然气、页岩气、甲烷水合物和煤层气的主要成分,是储量最丰富的碳基原料之一,也是除煤炭和石油以外,另一种重要的能源形式。此外,甲烷也是一种强效温室气体,其造成温室效应的能力为二氧化碳的25倍。因此,将其催化转化为具有高附加值的化学品,如甲醇、甲酸和乙酸,对于缓解石油的日益枯竭带来的能源、资源压力,缓解温室效应,创造经济收益均具有重要意义。上述产物中,甲醇具有非常广泛的用途,不仅是基础
原子层沉积(ALD)是纳米薄膜材料精准制备的先进技术。前驱体是原子层沉积的重要组成部分,良好的挥发性和稳定性是ALD前驱体最为核心的性质要求。铝的氮化物、氧化物及铝金属等材料在集成电路等众多领域有广泛的应用。随着纳米/亚纳米科学与技术的不断发展,ALD技术在这些材料的制备中也发挥了越来越重要的作用,随之也对铝前驱体提出了更高的要求。现有的铝前驱体在挥发性和热稳定性等方面已经不能适应ALD发展的需求