论文部分内容阅读
近几年消费金融的不断兴起和蓬勃发展,为不同阶层的客户提供了小额资金,有效刺激了消费市场发展。但是由于信息不对称现象的存在,以及受到国内缺乏健全个人征信体系的影响,使得借款人必然需要面对信用风险问题,导致投资人的权益受损,加重了消费金融公司的负担。越来越多的消费金融公司选择与第三方科技公司合作来进行风控筛查,例如芝麻信用分、同盾分、蜜源等,第三方科技公司通过多种信息来源交叉验证客户信用情况并进行评分,较好的补充了人民银行征信体系的不完整。充分利用第三方数据后,哪一种评分方法能够更好的识别客户的违约情况,进行降低违约风险,是本文需要探讨的话题。根据上述问题,本文拟以借款人的不同信息指标为对象,运用定性分析的方式进行对比与分类,找出信用风险受哪些信息指标所影响,同时利用消费金融常用的五种评估方法对违约情况进行评估,并对误判情况进行总结,为后续的分析提供具有创新性的、且较为全面的评价指标体系。按照以上思路为依据,拟将论文分为三部分:首先,介绍消费金融及其风险评分发展现状;然后,以借款人发生违约与否作为被解释变量,选取客户行业、收入、学历、所在城市、期限、利率、性别、婚姻状况、有无自有房产、年龄、工作年限、贷款金额、受理渠道和芝麻信用分共14个指标作为解释变量,先用这14项指标进行描述性统计分析,结果显示,年龄在26-35岁,初中及以下学历、男性、离异、职业是商业贸易类、工作期限在5-10年,无房且芝麻信用分较低的客户违约风险最高;最后,通过机器学习方法筛选出2513个样本数据,建立逻辑回归、随机森林、支持向量机、人工神经网络、贝叶斯分类器5种信用分析常用评估模型对违约风险进行评估与比较,通过综合准确率、违约贷款准确率以及模型误判来判定模型好坏,并用AUC进行模型检验,判定可信度。经分析发现,在对借款人的信用风险进行评价方面,运用随机森林模型能够实现准确率的提升,而支持向量机模型能够较好的识别借款人的违约风险及误判情况,对消费金融的风险评价和管理具有一定的现实意义。