论文部分内容阅读
随着中国经济的不断发展,中国的股票市场越来越完善,逐步作为中国经济的晴雨表和观察中国经济的重要指标,许多投资者纷纷将投资放在了股票市场,大量的学者也纷纷投身于股票市场的研究和分析,并且总结出了许多股票预测的分析算法和模型,从而帮助投资者减少投资的风险。股票市场每时每刻都会产生大量的数据,这些数据包括了证券市场每天的股票数据,上市公司的财务数据等。这些数据看似没有任何规律、毫无关联,但是数据之下却隐藏着被我们忽略的有价值的信息。由于数据量庞大,使用一般的的方法难以对股票进行预测分析。随着大数据的兴起,数据挖掘技术成为了大数据的研究热点,数据挖掘的相关技术能够从庞大的看似毫无规律、杂乱无章的数据中提取出有价值的信息。因此,在基于股票分析方法的基本面分析法和技术面分析法的基础上,本文以数据挖掘技术中的逐步回归算法和CART决策树算法为基础,提出一种基于决策树的逐步回归算法并运用在股票预测上,以A股上市公司的年报的财务指标作为分析对象,对股票进行预测和分析。本文筛选出2007家A股上市公司2013年、2014年、2015年年报中的财务指标作为分析对象,经过分析选取七大指标能力的29个有代表性的财务指标作为输入变量,运用SPSS Modeler软件建立相关模型,模型建立前,随机把数据的70%作为训练样本集,30%作为测试样本集。在逐步回归算法与上市公司财务指标模型中,筛选出对每股收益影响显著的财务指标,分析这些指标对每股收益预测的准确性,接着建立CART决策树算法与上市公司财务指标的等级分类预测模型,找出优质股与财务指标间关系,分析CART决策树模型的预测准确性,接着改进CART决策树模型,提高模型质量与模型预测的准确性,最后建立基于决策树的逐步回归算法与上市公司财务指标的模型,该新模型首先利用改进后的CART决策树模型筛选出重要财务指标,然后把筛选出的财务指标作为逐步回归的输入变量建立模型,与单一逐步回归模型相比,减少了无关财务指标对股票预测的干扰,消除无关指标对投资者分析股票时的误导性,提高了预测准确性,帮助投资者减少股票投资的风险。