论文部分内容阅读
消费信贷产业的蓬勃发展,以及消费信贷业务风险与回报相对应的客观规律,使金融机构在追逐巨额利润的同时,不得不面对巨大的信用风险,因此如何舰避潜在的信用风险是银行和信贷机构面临的重要课题。银行需要在发放信用贷款之前,对信贷客户进行科学的信用评估,客观、全面、准确地评估消费者的还款能力和还款意愿,以避免、控制、减少坏账损失。在西方国家,普遍采用个人信用评分定量地评价个人信贷消费者的信用状况。借助数据挖掘技术,构建信用评分模型,发掘数据中蕴含的模式和规律,作为消费者信贷管理的决策依据。在中国,由于社会征信体系的不完善,以及信贷消费产业的落后,个人信用模型的开发才刚刚起步,对于开发合适的信用模型缺乏经验,本文将对此进行探索。常用的信用评分技术一般分统计学方法和非统计学方法。统计学方法包括线性回归、判别分析、Logistic回归,决策树等,非统计学方法包括线性规划、神经网络、遗传算法、专家系统等。但是对于这些开发信用模型的技术,那种方法最好,还没有一致的结论。论文以真实的信贷数据为分析对象,使用最常见的判别分析、Logistic回归、神经网络等进行适应性研究。利用它们分别建立模型,对客户进行分类,并比较模型表现。对比发现,各种模型都有一定的预测能力,能将好坏客户适度地区分开来。其中Logistic回归模型在这三种技术中评估最佳。是当前商业银行可以采用的最优模型,值得在实践中推广。在建立信用模型的过程中,数据是建立个人信用评分模型的基础,离开数据,“巧妇难为无米之炊”。而实际中收集的数据一般都受到“污染”,所以在建立信用模型之前,必须对数据进行预处理。数据预处理备包括:数据清洗、数据转换以及变量聚类等,特别是对特征项过多的分类变量做了深入分析。最后对建模进行总结,针对实际的应用补充几点意见。指出论文不足之处,以及今后需要加以深入研究的课题。