论文部分内容阅读
近年来,随着我国经济的快速发展和人们消费观念的转变,信用消费在消费活动中逐渐占据核心地位。越来越多的人向商业银行或金融机构申请信用消费贷款,申请者关注于信贷申请是否能被批准,而商业银行或金融机构关心申请者能否按时偿还信贷。商业银行或金融机构通过将信用评分模型作为个人信用评分工具,预测申请者是违约客户还是信誉客户,进而判断是否将信贷授予申请者。如何精准识别潜在违约客户,最小化商业银行或金融机构因客户信用违约风险而造成的损失,是各金融机构一直以来需解决的核心问题。因此,建立完善有效的个人信用评分模型具有重要意义。本文采用某网贷平台个人网贷信用数据,在进行预处理时,采用单一填补法和众数法对缺失值进行填补,采用重抽样法对非平衡数据进行平衡处理。在此基础上,采用 Logistic 回归,Lasso-Logistic 回归以及基于 Shapley Value 的Lasso-Logistic回归三种方法建立个人信用评分模型。通过对个人网贷信用评分数据进行实证分析,以预测精度作为衡量标准,将样本数据分为训练集和测试集两部分,分析比较三种方法在信用评分中的预测效果。同时比较加入某网贷平台已有的信用评级指标前后,这三种方法的预测效果。通过对个人网贷信用数据采用这三种模型进行实证分析,结果表明,Logistic回归及其改进方法都具有很好的稳健性和预测性,并且从预测精度来看,Lasso-Logistic回归和基于Shapley Value的Lasso-Logistic回归的预测准确率明显高于Logistic回归。这是因为:Lasso-Logistic回归方法是在Logistic回归基础上加入惩罚项,使模型剔除了相对不重要的变量,降低了模型的复杂度,其预测精度最高;基于Shapley Value的Lasso-Logistic回归方法是将每个系数的相对贡献度作为其权重,使模型具有调整回归系数的作用,模型亦表现出高于Logistic回归的预测精度。同时,通过对比加入某网贷平台已有的信用评级指标前后的预测结果,发现在有平台信用评级的基础上再进行Logistic回归、Lasso Logistic回归以及Shapley Value Lasso-Logistic回归之后的总体预测准确率均明显高于无平台信用评级时的准确率,这为将Lasso和Shapley Value方法引入到个人信用风险评估模型中,构建合适且有效的基于用户相关数据的风控模型和反欺诈识别的方法提供依据。