论文部分内容阅读
随着人们生活水平的提高以及经济社会的快速发展,越来越多的信用消费和贷款发生在身边,这些业务的迅速发展给银行市场的经营带来了很多的好处,占据越来越重要的作用。信贷业务本身就存在各种不可控的因素,这些不可控的因素会带来风险,这样会给商业银行业务发展带来一定的损失,没有达到预期期望的回报。因此,能够建立一套科学合理的个人信用风险模型用来辨别贷款客户的信用风险,在评估到客户的信用风险差的基础上来选择不贷款或者少量贷款以及提高贷款利率来规避可能会产生的损失,对商业银行来说是很重要的事情。本文首先根据现商业银行信贷业务的对贷款客户的信用要求,列出了全面可以包含客户各方面信息的初始指标。在德国信用数据集的基础上,通过相关性分析、主成分分析和T检验这几种常用的方法,分别得到影响个人信用风险的指标体系;在此基础上提出了用kmeans聚类获得的聚类中心用于高斯混合模型的初始参数的聚类的方法,先得到6)个新的类别指标,然后利用非参数根据指标之间存在的差异进行检验,得到具体的指标体系,最后用k近邻分类算法预测分类精度说明高斯混合聚类优化得到的指标的分类效果更好。本文用分类精度来评估个人信用风险模型的好坏,用k近邻算法分别对相关系数法、主成分分析法、T检验法、kmeans-高斯混合模型方法优化的指标体系进行样本训练,得到各个指标体系的分类精度;通过改变6)值的大小来得到不同的分类精度,样本数据的分类精度也会在改变6)值的大小而发生改变,在6)值合理的范围内找到最优的分类精度,比较初始的指标体系的分类精度,分析结果可以看出优化后更少指标形成的指标体系的分类精度更高相对于初始的分类精度提高了0.21%、0.13%、0.97%、1.27%。根据k近邻算法分类效率低的缺点,利用粒子群优化算法搜索近邻,改进的分类算法在分类精度上略微有所提高,耗时也有所缩短。分析可得PSO-knn算法在指标体系下的分类精度的比较,相对于初始的指标分类精度分别提高了,0.54%、0.13%、0.8%、1.04%。结果分析也说明knn算法和PSO-knn算法是一种有效的个人信用评估方法,同时也可以知道高斯混合模型优化下的指标体系更能反映客户的特性。