基于LSTM深度神经网络的股票高送转预测模型研究

来源 :湖北大学 | 被引量 : 0次 | 上传用户:catva
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
送转是上市公司给各股东分红的一种方式,高送转指的是送转比例达到0.5及以上的股票,该行为有助于股票流动性的增加。从正面来看,该行为预示着公司正处于较快的发展期;另一方面,高送转也成为了某些公司在发展较差时提高股票流动性的一种手段。通过某公司上一年的股票数据对该公司下一年是否发生高送转进行预测对投资者具有较大的经济学意义。近年来高送转相关研究逐渐增多,但各学者更多倾向于使用传统机器学习或集成模型进行预测,且模型拟合能力始终不够理想,本文首先使用特征工程加传统模型的手段对高送转进行预测,随后引入LSTM深度网络对股票高送转进行预测并与传统模型进行比对。主要内容如下:(1)基于传统特征工程的股票高送转预测。使用两段法处理缺失值。将“日数据”压缩为十二月数据的日平均值。删除“年”、“日”数据中的相同和无用特征;使用独热编码处理所属行业数据。使用Lasso回归筛选出与高送转相关性较高的影响因子并消除共线性;使用PCA对数据进行降维。随后对数据进行标准差标准化。最后使用逻辑回归、SVM、XGBoost三种模型对处理之后的数据进行训练和性能评估。(2)基于LSTM深度神经网络的数据预处理。对缺失值的处理优化为分三段处理的方式,缺失值在0.7以上、0.3到0.7之间、0.7以下分别使用删除法、均值填补法、随机森林填补法进行处理;对日数据采取保留月时序数据的处理方式,求各特征各个月的均值,并将其转换为三维时序数据供LSTM模型使用;使用ADASYN+SMOTE过采样手段引入虚拟正样本解决样本不平衡问题;不再使用特征筛选和降维手段,将该工作交给深度网络自行完成。(3)构建LSTM深度网络模型并进行股票高送转预测。使用阈值调整法对网络模型中的batch_size、num_layer、hidden_size等参数进行调参;选用NLLLoss为损失函数,Adam为网络优化器;通过drop_out参数和L2正则化减弱过拟合。最终构建由两层LSTM神经元、两层全连接层组成的深度网络模型,并使用处理好的数据对模型进行3500轮训练。使用过采样前的数据作为预测集对模型拟合能力进行评估,可以得到综合98.13%的准确率,在正样本上可以达到89%的准确率,99%的召回率,auc得分为0.98。实验结果表明,LSTM深度网络对股票高送转数据具有较强的拟合能力,相比于传统机器学习模型或集成模型具有较大的模型性能提升,能够更好的完成下一年股票是否发生高送转的预测任务。
其他文献
恒黑、高湿度、恒温以及有限的能量输入使得洞穴成为了世界上最为极端的环境之一,同时也使洞穴生物也成为了遗传学、生物地理学和生态学研究的热点。特别是关于洞穴生物眼睛的退化,是自达尔文《物种起源》一书发表以来,生物学家最为关心的问题之一。近年来,趋光或避光行为在越来越多的无眼洞穴生物中被报道,但关于生活在恒黑环境中的洞穴生物为何要保留感光功能?至今仍然没有统一的解释。目前主要有两种假说:1、中性选择假说
学位
屈家岭时期是新石器时代长河下,一段不可忽视的历史,屈家岭文化独具特色,具有十分重要的研究意义,也是长江中游分布范围最庞大的文化之一,它的影响范围也较广泛。而陶器作为屈家岭文化中出土数量最多的一种器物,它与史前人民的日常生活息息相关,反映出了当时的历史文化和社会思想水平,且陶器形制具有多角度的研究价值。本文对屈家岭陶器形制进行系统性地分析总结,并以此为基础,创作出适用于当今社会的形制创新产品设计,为
学位
近年来,由于城市信息化水平的日益发展,监控摄像头的数量也越来越多,摄像头的广泛使用以及深度学习的飞速发展,为智慧城市的建设打下坚实的基础,也为提高建筑效能、家用机器人、教育、保护环境等领域做出了巨大的贡献。目前人体目标检测的应用场景大部分都在室内,而当前检测算法的研究对象多为室外的行人,室外行人主要在开阔场景下采集,人体大多呈行走,直立状态,图片中的目标大多比较完整。但在室内环境下,由于空间较小,
学位
技术能对司法文书的内容进行压缩总结,生成涵盖裁判过程和事实依据的要点内容,对智慧司法的建设和应对法律信息过载具有重要意义。本文结合司法领域的文本特点,对司法文书研究其抽取式和生成式文本摘要算法。具体研究内容如下:(1)融合篇章结构的多任务学习摘要研究。针对现有抽取式摘要模型难以捕获司法文书区别于普通文本的规范性特征,本文利用文书不同结构对于摘要贡献度的不同提出一种多任务学习模型,以共享参数的方式将
学位
在互联网海量信息的数据中,文本是最主要的表现形式,这些文本信息多以非结构化的形式呈现出来。命名实体识别技术可以从非结构化的文本中识别人名和地名等含有特定意义的实体。命名实体识别的结果可以用于关系抽取、事件抽取、知识图谱构建等下游任务中,其结果的好坏直接影响下游任务的效果。命名实体识别任务根据命名实体是否嵌套分为非嵌套命名实体识别和嵌套命名实体识别,本文对这两个任务进行研究。具体的研究内容如下:(1
学位
随着无人机行业发展的不断成熟,在许多行业都引入无人机航拍获取图像信息。无人机具有操作便捷、不受场地限制的许多优点,但是无人机相机只能获取有限视野的内的图像,难以对场景的实际情况进行反映。因此需要采用图像拼接技术得到航拍图像的全景图。传统的图像拼接算法虽然已经被成熟地集成在商业软件中,但大多基于全局单应性的配准变形方法,难以解决航拍图像拼接过程中的视差问题。并且这些采用单一的特征的图像拼接算法又由于
学位
随着深度神经网络在各领域越来越广泛的应用,学者们也越来越关注深度神经网络的安全性。在21世纪人工智能时代已经到来的环境下,深度神经网络在计算机视觉领域特别是图像分类任务中取得了相当好的效果。然而,有研究表明,在输入样本中添加人眼不可见的微小扰动,能够成功地欺骗深度神经网络,使得DNN分类模型发生误判。这种添加了扰动的样本叫做对抗样本,通过对抗样本使得深度神经网络出错的方法叫做针对深度神经网络的逃逸
学位
企业简介是企业信息的重要来源之一,大量有价值的企业信息蕴藏在各种企业简介中,如何从企业简介中高效地抽取信息,是自动化构建企业信息管理系统的基础。企业命名实体识别和关系抽取是将机器学习、深度学习等技术应用于企业信息管理领域,准确、快速地实现企业信息的抽取,从而帮助企业快速地构建企业信息知识图谱,辅助企业决策。为此,本文以企业简介文本为基础,通过抽取企业相关实体与关系,实现企业信息抽取,具体工作如下:
学位
由于社会的进步和信息科技的发展,人们加快了走向互联网时代的步伐,网络上出现层出不穷的信息供用户阅览,但用户难以在海量数据中找到自己真正想要的信息。推荐系统的出现缓解了这一问题,在解决信息过载问题的同时还能给使用者提供个性化服务。传统的推荐系统存在推荐结果解释性低、用户或物品冷启动等问题,知识图谱作为升级版知识库加入到推荐系统中,有助于增加用户和物品信息的丰富度,提高推荐结果的精准性。现存的一些推荐
学位
为了弄清硒矿粉中硒的生物有效性,为硒矿粉的农业利用提供依据,本研究设置了土壤施硒矿粉0、3、5、10、20、25、50 g/kg和亚硒酸钠1、5 mg/kg的处理,进行了为期4个多月的萝卜盆栽实验,测定了萝卜种子的发芽率、萝卜苗硒含量、生物量、维生素C(Vc)、可溶性糖、丙二醛(MDA)、光合色素、水溶性养分含量、过氧化氢酶(CAT)活性和萝卜成熟期硒含量、生物量、营养元素含量,以及盆栽土壤硒含量
学位