基于决策树的逐步回归算法及在股票预测上的应用

来源 :广东工业大学 | 被引量 : 9次 | 上传用户:pfeiyuan2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国经济的不断发展,中国的股票市场越来越完善,逐步作为中国经济的晴雨表和观察中国经济的重要指标,许多投资者纷纷将投资放在了股票市场,大量的学者也纷纷投身于股票市场的研究和分析,并且总结出了许多股票预测的分析算法和模型,从而帮助投资者减少投资的风险。股票市场每时每刻都会产生大量的数据,这些数据包括了证券市场每天的股票数据,上市公司的财务数据等。这些数据看似没有任何规律、毫无关联,但是数据之下却隐藏着被我们忽略的有价值的信息。由于数据量庞大,使用一般的的方法难以对股票进行预测分析。随着大数据的兴起,数据挖掘技术成为了大数据的研究热点,数据挖掘的相关技术能够从庞大的看似毫无规律、杂乱无章的数据中提取出有价值的信息。因此,在基于股票分析方法的基本面分析法和技术面分析法的基础上,本文以数据挖掘技术中的逐步回归算法和CART决策树算法为基础,提出一种基于决策树的逐步回归算法并运用在股票预测上,以A股上市公司的年报的财务指标作为分析对象,对股票进行预测和分析。本文筛选出2007家A股上市公司2013年、2014年、2015年年报中的财务指标作为分析对象,经过分析选取七大指标能力的29个有代表性的财务指标作为输入变量,运用SPSS Modeler软件建立相关模型,模型建立前,随机把数据的70%作为训练样本集,30%作为测试样本集。在逐步回归算法与上市公司财务指标模型中,筛选出对每股收益影响显著的财务指标,分析这些指标对每股收益预测的准确性,接着建立CART决策树算法与上市公司财务指标的等级分类预测模型,找出优质股与财务指标间关系,分析CART决策树模型的预测准确性,接着改进CART决策树模型,提高模型质量与模型预测的准确性,最后建立基于决策树的逐步回归算法与上市公司财务指标的模型,该新模型首先利用改进后的CART决策树模型筛选出重要财务指标,然后把筛选出的财务指标作为逐步回归的输入变量建立模型,与单一逐步回归模型相比,减少了无关财务指标对股票预测的干扰,消除无关指标对投资者分析股票时的误导性,提高了预测准确性,帮助投资者减少股票投资的风险。
其他文献
习近平总书记近日对实施乡村振兴战略作出重要指示强调,实施乡村振兴战略,是党的十九大作出的重大决策部署,是新时代做好“三农”工作的总抓手。各地区各部门要充分认识实施
立足电压源换流器(VSC)-高压直流(HVDC)输电工程实际,旨在解决选用何种VSC拓扑方能使VSC-HVDC输电达到最佳性能,即找出相对最优的VSC拓扑及其调制策略。结合相应衡量指标,首
最近业内对中小房企破产的事关注颇多。人民法院网公布数据,今年上半年发布破产文书或进入破产清算程序的房企有200多家,三四线城市中小型开发商占比较高,而在去年一整年实际
[摘要] 目的 探讨IgM抗体实验室检测结果对流行性出血热患者诊治和防治的意义。 方法 选取我院2017年7月~2019年6月出血热患者180例,对血清标本进行流行性出血热IgM抗体酶联免疫吸附试验(ELISA),并对此试验的特异性、灵敏度、阴阳性预测值及有效率分析。 结果 流行性出血热抗体阳性患者56例,阳性率31.11%。此次研究ELISA试验检测流行性出血热IGM抗体的特异性、灵敏度、诊断有
目的探讨重组人血管内皮抑制素(rhES)治疗晚期非小细胞肺癌(NSCLC)的临床疗效及其对患者肺功能的影响。方法选取2016年5月~2019年5月于我院就诊的168例NSLCL患者为研究对象,
口腔潜在恶性疾病作为有癌变风险的一类疾病,不仅会损害身体功能,而且会严重影响患者的心理、家庭、社交等。作为新医学模式发展的产物,口腔健康相关生存质量评估得到了越来
目的探讨多层CT肺动脉造影在肺动脉栓塞诊断中的应用。方法对384例临床疑有肺动脉栓塞患者进行CTA检查,采用多平面重建(MPR)、最大密度投影(MIP)、曲面重建(CPR)及容积重建(VR)技术显
目的 探讨慢性阻塞性肺疾病合并肺结核患者外周血淋巴细胞亚群的变化及意义.方法 回顾性收集2017年1月~2019年8月于我院住院的45例慢性阻塞性肺疾病合并肺结核患者(研究组)外
物业管理是维护城市正常运行、保障百姓美好生活的基础性行业。在2020年突如其来的疫情遭遇战中,四川新华物业有限公司(下称“新华物业”)迎难而上,主动担当,始终奋战在战“