论文部分内容阅读
个人信用评估是金融风险管理的一个重要应用。近年来,商业银行面临的竞争和挑战日益严重。个人贷款量和信用卡数量大幅度增加,大量的贷款违约对商业银行带来巨大的损失,为了减少损失、节约成本并有效地制定决策,建立一个有效的个人信用评估体系对我国商业银行来说至关重要。本文在对以往个人信用评估建模方法回顾的基础上,发现目前个人信用评估模型存在如下问题:首先,新提出的评估模型在预测精度等分类指标上没能够取得取得明显的进步,特别是第二类误判率;其次,目前的主要评估模型都基于神经网络和支持向量机两种方法,而这两种人工智能方法的可理解性较差;第三,最新提出的集成方法虽然在预测精度上有所提高,但计算成本大。为了能够有效地解决目前个人信用评模型中存在的问题,本研究建立了一个基于决策树(Decision tree)和贝叶斯网络(Bayesian network)的新型混合个人信用评估模型一DTBN。构建DTBN分类器的过程包括两个步骤。首先第一步利用所有的训练样本生成决策树模型,第二步将决策树每个叶节点下的错分样本挑选出,并且分别生成贝叶斯网络。DTBN的核心思想在于用贝叶斯网络将决策树叶节点下的错分样本进行重新判断,以此提高分类精度。本文采用的是德国1000份客户信用数据,采用10次10倍交叉验证的方法评估分类器的分类效果。实验结果表明DTBN的平均正确为87.05%,第一误判率和第二误判率分别为3.01%和34.24%。三个指标均优于决策树和贝叶斯网络两个单一模型,以及前人在德国数据上建立的其他信用评估模型。DTBN的一个明显优势在于大大降低了两类误判率,特别是第二误判率。此外,DTBN还具有可理解性好、计算成本小的优势。本研究的贡献在于:首先,提出了一种基于决策树和贝叶斯网络的个人信用评估模型,该模型能够有效地提高分类正确率和降低两类误判率,并解决了目前模型存在的可理解性差、计算成本大的问题,为今后的研究提供了一种新的思路。第二,在构建模型时采用了并不常用的特征选择方法一-Greedy stepwise,该特征选择方法对决策树模型非常实用,结果表明较少的特征数目取得了很好的分类效果。第三由于采用了贝叶斯网络对错分样本再分类,新方法成功地较大程度地降低了第二误判率,因此本研究提供了一种降低两类误判率特别是第二误判率的新思路。