论文部分内容阅读
随着消费金融的不断发展,贴近于消费场景的金融公司不断出现,极大的满足了大量客户的信贷需求。然而,因为客户群体更分散、贷款金额更加微小,信贷手续简单、审批快速等独具的特点,使得违约事件频频发生。消费信贷客户违约预警已经成为消费金融机构的重点工作,完善的风控管理机制可以提升消费金融市场的业务规模,降低信贷违约风险,增加利润,因此建立一套准确、适用的消费信贷客户违约预警指标体系是使金融机构有效规避信用风险且进一步促进信贷行业发展的关键。本文重点研究消费信贷客户违约风险预警问题。针对消费信贷客户违约的问题特征,基于大数据挖掘技术,对真实的大规模消费信用数据进行深度挖掘和分析,解决违约预警面临的数据高维度问题,构建违约预警指标体系,提高消费信贷违约预警准确率。首先,基于捷信消费金融公司31万多条真实的客户信用数据,进行数据预处理并构造特征;其次,结合消费信贷自身特点,采用随机森林算法进行特征选择,筛选出重要的特征变量;然后,构建基于LightGBM算法的消费信贷客户违约预警模型,并与逻辑回归、GBDT、随机森林以及XGboost算法对比性能的优劣;最后进一步量化违约行为特征,进而构建消费信贷客户违约预警指标体系。实验结果表明:LightGBM模型可以有效地对消费信贷客户违约风险进行预测,其准确率高达0.933,召回率为0.752,AUC为0.814,评价指标的稳定性表明该模型在分类问题上具有良好的性能;针对消费信贷客户违约风险预警问题,随机森林在特征选择上比其他算法更优。研究发现,客户的个人特征、借款特征、经济特征以及历史特征对消费信贷客户违约预警有着重要的作用。具体上,在个人特征方面,住址区域评级、性别、年龄和教育程度是客户违约的重要影响因素;在借款特征方面,利率、借款期限、消费商品价格、借款金额以及借款目的是影响信贷违约的关键特征,在一定程度上可以反映出消费客户预期的自身还款能力;在历史特征方面,违约30天的次数、实际偿还贷款期、还款宽限天数以及债务等是识别客户违约的重要特征;在经济特征方面,自付金额以及年金与收入比对客户是否会发生违约行为起着决定的作用。基于以上结果,本文构建了消费信贷客户违约预警指标体系,对消费金融行业有针对的防范风险,推动消费信贷健康稳定发展具有重要的意义。