论文部分内容阅读
近十年来中国经济高速增长,金融机构越来越多,信贷规模在投资驱动的新经济增长模式下迅速扩张,加上经济下行趋势和利率市场化因素二者的叠加影响,企业信用风险日益增加。中国银监会最近公布了2019年商业银行不良贷款率高达1.81%,是最近7年最高的不良贷款率,比2018年的高出0.14%。因此应当建立企业信用风险评估体系和评估模型,帮助银行降低信用风险,科学的指导银行对贷款的发放和预防,也可以促进中国经济增长。
在企业信用评估的研究当中,构建模型是核心部分之一。随着技术日新月异的发展,学者对该问题的深入研究,信用风险评估的方法从主观经验的专家分析法演变为逐步量化的模型构建,再到今天备受广大学者和业界人士关注的基于机器学习技术模型中的支撑向量机(Support Vector Machine,SVM)模型,并将广泛运用于模型的识别、统计分类和回归分析研究中。因此,SVM作为信用风险评估的方法,可以对不良贷款和优良贷款的主体进行分类,以求实现很好的分类性能和功能,更好地应用于信用风险评估。
本文首先分析了企业信用风险的背景和商业银行不良贷款的现状,并对国内外关于信用风险评估的研究进展进行归纳和总结,发现大多数国内外学者多关注在信用风险评估模型指标体系的构建和评估模型的方法这两个方面,同时发现SVM模型在信用风险评估中的应用很广泛;其次分析了信用风险评估的方法和相关原理,在原有的财务指标基础上引入非财务指标,并构建了一套较为完整的企业信用风险评估指标体系;最后以2015-2017年这三年的A股上市公司为样本、共2万多个数据、共计21个指标进行仿真实验与分析。
首先构建了基于主成分分析(PCA)的Logistic模型,用SPSS软件对企业信用风险进行实验分析,提取了10个主成分,累计贡献率74%,模型对正类样本的预测准确率仅为7.3%,且模型的拟合优度检验显著度小于0.05,模型拟合度不高,发现Logistic模型评价企业信用风险的效果不好。其次,进一步研究基于SVM模型构建企业信用风险评估模型,将主成分分析方法(PCA)、合成少类过采样方法(SMOTE)与通过网格搜索法(GS)进行参数寻优,使之与SVM进行结合,并构建PCA-SMOTE-GS-SVM模型评估企业信用风险,既解决了由于指标过多产生的维数灾难问题又解决了样本数量不平衡问题以及内核函数的参数优化问题。用Python进行仿真实验对比logistic模型、SVM模型以及PCA-SMOTE-SVM模型等,仿真结果表明,没有平衡数据的logistic模型分类效果一般,与其他模型相比,所提出的PCA-SMOTE-GS-SVM模型特别是PCA-logistic模型,在企业信用风险评估中具有更高的稳定性及预测能力,预测准确度达到95%,且AUC高达97%;PCA-SMOTE-SVM的准确度为83%,PCA-SMOTE-logistic也仅为78%,其结果表明了在企业信用风险评估研究上,本文所提出的模型在信用风险评估方面具有一定的参考和借鉴意义。
在企业信用评估的研究当中,构建模型是核心部分之一。随着技术日新月异的发展,学者对该问题的深入研究,信用风险评估的方法从主观经验的专家分析法演变为逐步量化的模型构建,再到今天备受广大学者和业界人士关注的基于机器学习技术模型中的支撑向量机(Support Vector Machine,SVM)模型,并将广泛运用于模型的识别、统计分类和回归分析研究中。因此,SVM作为信用风险评估的方法,可以对不良贷款和优良贷款的主体进行分类,以求实现很好的分类性能和功能,更好地应用于信用风险评估。
本文首先分析了企业信用风险的背景和商业银行不良贷款的现状,并对国内外关于信用风险评估的研究进展进行归纳和总结,发现大多数国内外学者多关注在信用风险评估模型指标体系的构建和评估模型的方法这两个方面,同时发现SVM模型在信用风险评估中的应用很广泛;其次分析了信用风险评估的方法和相关原理,在原有的财务指标基础上引入非财务指标,并构建了一套较为完整的企业信用风险评估指标体系;最后以2015-2017年这三年的A股上市公司为样本、共2万多个数据、共计21个指标进行仿真实验与分析。
首先构建了基于主成分分析(PCA)的Logistic模型,用SPSS软件对企业信用风险进行实验分析,提取了10个主成分,累计贡献率74%,模型对正类样本的预测准确率仅为7.3%,且模型的拟合优度检验显著度小于0.05,模型拟合度不高,发现Logistic模型评价企业信用风险的效果不好。其次,进一步研究基于SVM模型构建企业信用风险评估模型,将主成分分析方法(PCA)、合成少类过采样方法(SMOTE)与通过网格搜索法(GS)进行参数寻优,使之与SVM进行结合,并构建PCA-SMOTE-GS-SVM模型评估企业信用风险,既解决了由于指标过多产生的维数灾难问题又解决了样本数量不平衡问题以及内核函数的参数优化问题。用Python进行仿真实验对比logistic模型、SVM模型以及PCA-SMOTE-SVM模型等,仿真结果表明,没有平衡数据的logistic模型分类效果一般,与其他模型相比,所提出的PCA-SMOTE-GS-SVM模型特别是PCA-logistic模型,在企业信用风险评估中具有更高的稳定性及预测能力,预测准确度达到95%,且AUC高达97%;PCA-SMOTE-SVM的准确度为83%,PCA-SMOTE-logistic也仅为78%,其结果表明了在企业信用风险评估研究上,本文所提出的模型在信用风险评估方面具有一定的参考和借鉴意义。