论文部分内容阅读
随着中国经济的飞速发展,信用消费在个人消费方式上也越来越占据主导方式,小额贷款公司如雨后春笋般出现并得到了迅速发展,截至2018年1月数据,目前国内已经有3000家小额贷款公司。相比于西方国家成熟的个人贷款行业,我国该行业的劣势就是我国的征信体系还在发展阶段,每个公司都有自己的一套完整的征信模型。在个人消费信贷的发展过程中,小额贷款公司主要面对的问题就是评估个人的信用风险来决定是否批准申请人的贷款需求,因此,对个人信用评分模型的研究具有非常重要的实际价值。过去很多学者的研究重点都在银行数据的个人信用评分,随着小额贷款公司业务量的增加,个人信用贷款的数据也是在不断积累。本文的研究重点就是利用个人的贷款数据去建立个人信用评分模型,也就是风控模型。利用应用统计学和机器学习的知识,系统的还原了实际信用评分卡模型的整个步骤。做信用评分卡模型的统计方法有Logistic回归模型、KNN、神经网络、决策树,随机森林等方法,此外也可以用非统计方法,或者一些规则去判断。本文主要利用Logistic回归模型来解决个人信贷需求批准与否的问题。被接受的申请人的样本和所有申请人总体之间是存在样本偏差的,建模时用的是被接受的申请人组成的样本,创建的信用评分模型会存在样本偏差的问题。为了获得更加合理准确的预测结果,可以通过对拒绝样本做拒绝推断来尽量的减少这种偏差。本文就拒绝推断的方法做了详细的介绍,并对其中的硬截止方法进行了实证分析,并与没有进行拒绝推断的模型进行对比,得到结论。