基于递归特征消除和Stacking集成学习的股票预测实证研究

来源 :南宁师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:chaosum
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以沪深300为投资标的池,选取波动指标、收益指标、经典技术指标和交易指标等4大类指标共24个二级指标作为评价因子,用递归特征消除法结合Stacking集成学习以及传统的随机森林、支持向量机和逻辑回归等4个机器学习算法分别构建分类模型,预测投资标的池中周频收益率排名前20%的股票标的,为投资者提供量化投资策略.实证研究对这4个模型的分类预测效果进行了比较.结果表明,基于递归特征消除法和Stacking集成学习的模型的预测性能最高,其AUC值达到0.644 7,准确率为60.21%,精确率为59.87%,召回率为62.65%,F1值为61.23%.因此,基于递归特征消除法和Stacking集成学习的模型能够有效地为投资者选取高收益率的投资标的,是一个可行的基于机器学习的量化投资策略.
其他文献
城市湿地是湿地生态系统碳循环的重要组成部分,研究城市湿地温室气体(CO2/CH4)排放特征及其影响因素对区域的碳平衡估算以及控制温室气体排放具有重要的意义.于2019年11月到2020年1月(秋季)利用密闭箱-气相色谱法对南湖湿地水气界面(CO2/CH4)通量进行了观测,结果表明,南湖秋季水-气界面CO2平均通量为-184.73±400.14 mg CO2/m2·h,整体为大气CO2的汇,南湖秋季水-气界面CH4平均通量为0.96±2.2 mg CH4/m2·h,整体为大气CH4的源.水体溶解性无机碳是影
发展休闲农业旅游是实现农业与第三产业融合发展的重要路径.以广西为例,从数量、类型、等级和空间属性4个维度构建了区域休闲农业旅游资源综合指数,综合运用资源丰度指数、变异系数、自然断点法和相关系数等方法,探究了县域休闲农业旅游资源的开发空间特征,并提出了空间优化策略.结果表明:(1)县域休闲农业旅游资源整体质量水平一般,吸引力有限,组合类型不够丰富,但是有一定的资源数量规模,开发潜力比较大.(2)县域资源的等级空间表现出连片团状、零星状和环状的发展特征,具有星棋罗盘状、不规则“田”字型格网状、浅“V”型、长带