论文部分内容阅读
P2P(Peer to Peer)即表示个人对个人.P2P网贷作为互联金融的子业,是个人与个人之间借助网贷平台直接实现双方借贷交易的业务模式.近年来,P2P网贷行业在国内外发展进行的十分火热,各类模式的网贷平台也随之陆续出现.尤其是在国内,根据网贷之家数据显示,直至2018年年底,P2P网贷平台已经累积达到6000家以上,但是网贷平台同时也爆发出跑路、停业等恶劣现象,其中平台借款人大量出现违约行为会严重影响P2P网贷行业的稳定发展.因此本文对网贷平台借款人信用风险进行重点研究,建立一个快速而有效的网贷平台贷前审核借款人信用风险评估模型,从而促进P2P网贷行业未来的健康发展.本文首先介绍了三种树的集成模型对网贷平台借款人信用风险进行快速有效评估,分别是梯度提升决策树(GBDT)模型、随机森林(RF)模型和极端梯度提升(XGBOOST)模型,然后通过获取人人贷平台散标借款人网贷数据,将预处理完后的数据随机分为原始训练集和原始测试集.由于借款人网贷数据存在不平衡现象,利用Borderline-SMOTE算法平衡化原始训练集后,得到BLSMOTE训练集.在各模型进行建模及预测前,选用5折交叉验证法进行模型参数调优取较优值,分别在原始训练集和BLSMOTE训练集下各模型训练预测得出相应的分类评价指标和运行时间.将各模型的分类评价指标和运行时间作对比,得出结论:在BLSMOTE训练集下,XGBOOST模型和GBDT模型的分类性能有所提高,而RF模型的分类性能略微下降.在原始训练集和BLSMOTE训练集下,XGBOOST的分类性能均比GBDT模型和RF模型要好,其中分类评价指标中的ACC值和AUC值均比后两者大,相应得到的ROC曲线也比后两者要更往左上方(0,1)点处靠拢.XGBOOST模型预测得出FP和FPR(第一类误分率,即将较差还款人误分为较好还款人的比例)均比GBDT模型和RF模型要小.在运行时间上,XGBOOST模型消耗时间最短.因此,本文认为XGBOOST模型是一个快速而有效的网贷平台贷前审核借款人信用风险评估模型,可以为平台管理者提供有效评估和管理的参考价值.