论文部分内容阅读
企业破产数据中存在高维不平衡的特性,会导致模型预测性能降低且预测结果偏向于多数类。为了提高具有破产风险企业的预测准确率,将从特征、数据、模型三个方面综合考虑。首先提出一种Pearson相关系数特征提取规则进行特征选择,再使用已有的平衡化技术进行数据平衡化处理,最后提出了一种基于改变分类阈值的随机森林算法构建企业破产预测模型。在包含10173个公司数据集上的实验结果表明,本文的研究方法具有一定的优越性,对后续进行企业破产预测研究也具有较高的参考价值。