论文部分内容阅读
随着我国经济持续快速的发展,上市公司的经营环境变的越来越复杂,加上企业在国际上竞争压力的不断加大,上市企业的财务风险问题更加需要得到关注。如果不关注企业的财务风险状况,就会导致财务风险不断累计从而最终引起财务危机,从而被ST标记。财务危机从它的产生过程来讲是在财务上面逐步显现的,所以可以通过使用财务指标体系构建模型来对企业财务危机做预警。就财务风险预警研究现状而言,为了提高财务风险预警的精度,众多的研究学者展开了长期研究和探索,并形成以单变量模型和多变量模型为代表的预警方法。目前已经提到的财务风险预警模型有很多,但是大部分都存在以下问题:一般都存在因为训练不足而导致学习不足或者过拟合;需要调节的参数较多,且随着训练样本的增加而导致训练成本急剧上升;只能实现定点预测,而无法对预测的结果做进一步的划分。针对上述的问题,本文提出了结合模糊数学理论和随机森林的模糊随机森林模型。随机森林(Random Forest,RF)是数据挖掘领域中的代表算法,能够从有限的数据中挖掘出大量的信息,RF算法以Bootsrap重抽样法获取训练样本,其基本思想是构造多决策树模型,具有预测精度高、泛化误差可控、收敛速度快、调节参数少等优点,可以有效的避免过拟合现象发生,尤其适合高维数据的运算。通过结合模糊数学来将二分类数据模糊转化为多分类数据,再输入到随机森林模型中进行训练预测,就可以得到一个能够做多分类预测的模糊随机森林模型,进一步挖掘样本内部更深层次的信息。本文研究了随机森林算法的理论知识,结合模糊数学对随机森林算法做了一定的改进,然后将结合了模糊数学的随机森林算法应用在了企业财务风险预警领域。主要工作如下:1)从网络上爬取了 A股上市公司2013到2017的财务数据,并计算出了其财务指标比率,使用了季报数据,相对于其他学者在企业财务风险预警领域使用的年报数据,本文的数据量扩大到了其四倍,数据量的增大也使得本文构建的模型更加精准。2)本文首次将随机森林算法应用到企业财务风险预警领域,通过引入模糊数学理论,借鉴Bagging方法和Breiman随机森林方法的思想提出了模糊随机森林。该方法克服了传统财务预测模型只能得到二分类结果的缺陷,可以得到更加细致的财务风险等级划分。