基于LSTM的多指标联合股票趋势预测

来源 :云南大学 | 被引量 : 0次 | 上传用户:chenpeng12333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济社会的发展,人们生活水平逐渐提高,拥有更多的闲置资金,于是把目光转向一些理财产品上,股票因其有着较高收益的特性,成为了多数人的选择。但股票在有着高收益的同时也有着较高的风险性,股市纷繁复杂、变化莫测,诸多因素都对股价有着重要的影响。得益于行为金融学理论的支持,人们逐渐关注投资者的心理状况和情绪对于股市的影响。近年来,机器学习和自然语言处理技术飞速发展,使得通过网络媒体的文本信息来度量投资者情绪有了较大的可能性,进而能够挖掘金融文本所反映的投资者情绪与股价变动之间的关系。大量研究文献表明,金融文本背后的投资者情绪与股价变动确有密切关系。基于这一观点,本文收集大量金融文本,通过情感词典和机器学习的方法,充分提取其特征信息,以充分挖掘隐藏在金融文本后的投资者情绪,通过目前主流的LSTM、随机森林、XGBoost方法,设置比对实验,验证了加入金融文本这一因素后,有助于股票价格预测效果的提升这一猜想。本文基于金融文本和股票市场公开的历史交易数据,利用LSTM构建股价预测模型,得到以下三个结论:第一,融入金融文本特征的LSTM预测模型比未融入金融文本特征的LSTM预测模型效果好,说明研究股价预测问题,金融文本这一特征不容忽视。第二,融入金融文本特征的模型比未融入金融文本特征的模型在随机森林和XGBoost分类任务上都有着更好的表现。第三,本文使用随机森林和XGBoost分类预测的结果对LSTM回归预测的结果进行修正,提出LSTM区间修正算法,将此方法应用于投资选股的策略之中,并同其他方法比较,本文所提算法在投资收益的表现上较佳。
其他文献
医学研究者能够通过生物成像技术从多个异构来源收集大量高维数据,继而用于医学研究。在乳腺癌的研究中,通常有多个来源的数据集,如乳腺超声数据集、乳腺钼靶数据集和乳腺MRI数据集等,联合两个或两个以上的数据源对乳腺癌的研究是有利的,通常医学研究者通过乳腺超声+乳腺MRI或乳腺钼靶+乳腺MRI来提高乳腺癌的预测能力。本文获取的数据是2017年3月-2020年12月昆明医科大学第二附属医院的乳腺患者超声数据
学位
洛伦兹曲线是比较和分析财富分配问题的重要参考指标,通常被用于衡量一个经济区域内的财富分配是否合理。洛伦兹曲线的拟合通常基于收入数据,在以往的研究中,统计学者们大多是基于是完全数据的情况来研究洛伦兹曲线。然而,在现实生活中,数据缺失的情况普遍存在。在数据不完整的情况下,继续采用传统的统计分析方法会导致估计结果出现偏差。目前对洛伦兹曲线进行研究的文献中,很少有文献讨论数据存在缺失的情况下如何对洛伦兹曲
学位
随着当今世界医学成像技术的快速发展,核磁共振成像(MRI)和功能性核磁共振成像(FMRI)技术普遍用于医学疾病的诊断研究中,例如阿尔茨海默症。医学研究者们普遍认为阿尔茨海默症是一种由于大脑功能紊乱造成的疾病,从而研究阿尔兹海默症的脑区功能连接网络是医学研究者重点关注的问题。脑区功能连接网络的确定通常根据医生的经验和文献查询的方式来获得,这类方法缺乏以数据分析为基础去探讨脑区功能的连接网络,因此如何
学位
基尼系数是衡量收入分配平等程度的指标,根据基尼系数的大小,可以准确地判断居民贫富差距。因此,精确估计基尼系数是尤为重要的。而基尼系数的计算依赖于收入数据,在实际生活中,由于收入涉及个人隐私,使得收入数据往往是存在缺失的。因此,从缺失数据的角度出发考虑基尼系数的估计问题更加具有现实意义。本文分别研究了完全数据和缺失数据情形下基尼系数的统计推断问题,以标准化的基尼平均差计算公式为基础,在完全数据集下,
学位
股票是现代社会众多获取投资收益的投资方式之一。股票是股份公司获取资金的重要方式之一。股票预测一直是研究的重点与难点,人们为了在股票投资中获取收益,一直尝试不同的预测模型对股价及其走势进行预测,好的股价预测模型可以帮助股民获取更多的投资收益。时间序列模型由其时间复杂度低、短期预测有效而得到广泛应用。近几年机器学习得到了广泛研究与应用,许多机器学习算法被应用于金融问题的研究,如随机森林、神经网络和高斯
学位
在医学领域、经济领域、工业领域和环境问题等的跟踪研究中,常常会收集到纵向数据和生存数据这两类复杂数据。在我们的建模过程中,纵向过程与生存过程通常是有关联的,因而联合建模这两类数据常被采用。它减少了对建模效果的估计偏差,并提高了对建模效果和其他因素的评估效率。常见的联合建模方法一般有两阶段法、共享随机效应项和共享轨迹函数。关于联合模型的参数估计方法,有频率学派方法和贝叶斯方法。与频率学派方法相比,贝
学位
如今,社会老龄化现象越来越严重,阿兹海默症的发病率也逐渐增高,严重影响老年人的身体健康,给社会带来了新的问题和挑战。传统阿兹海默症的诊断研究是基于测量量表和核磁共振成像MRI、FMRI数据相结合的诊断技术。阿兹海默症的脑图像数据随着年龄的变化而变化,且目前没有较好的诊断技术来研究阿兹海默症进程的变化情况。因此如何对不同时段人脑图像数据建模分析探索阿兹海默症进程的变化是本文主要研究问题。本文采用动态
学位
简单介绍了光刻胶的组成部分,综述了近年来国内外光刻胶成膜树脂合成、开发的研究进展,并根据不同曝光波长所需的不同光刻胶(包括紫外(UV)光刻胶、深紫外光刻胶、极紫外光刻胶等)进行了介绍。重点介绍了各光源下分子量和分子量分散指数对光致抗蚀剂的影响,并对国内外研究中通过不同聚合工艺制备的不同分子量光致抗蚀剂性能进行了评述,总结了近年来含有特定化学结构的光致抗蚀剂以及其制备工艺的研究进展。最后对国内外光刻
期刊
在跟踪研究中,通常会观测到同一个体的两个及以上的事件时间,在实际情况中,这些事件时间往往不是独立的。尤其在成对的器官中,当一个器官失效,另一个器官的生存时间也会发生变化,比如同一个人两个不同器官的衰竭时间、癌症复发时间和死亡的时间等,这些二元生存数据之间存在相依性。把相依生存数据看作独立的生存过程来研究,得到的结果会是有偏的甚至是错误的。因此,建立二元相依生存分析模型并对其进行统计诊断具有重要的理
学位
缺失数据和失效时间数据通常同时存在于医学、生物学、社会科学、经济学等领域,特别是在一些生物医学相关的研究当中,数据往往是缺失的,例如在肺癌的研究中,由于某些病人跟踪一段时间后突然离世,从而造成数据的缺失。还有在对抗癌药物的研发过程中,需要将不同剂量的抗癌药物注射到小鼠体内,通过观测注射药物后小鼠体内肿瘤的体积大小来验证药物的药效,然而,在实验完成之前由于各种原因,小鼠可能会死去,或者由于一些其他原
学位