论文部分内容阅读
P2P网络借贷能够直接将借款者与出借者进行线上点对点的资金对接,这种借贷模式具有低成本与线上交易的便利性因而在借贷市场上广受欢迎。但是随着P2P网贷平台数量的骤增,问题平台也开始大量涌现,对此监管部门出台了相应的监管细则,促使P2P网贷平台要转向借款资金小而分散、风险可控的资产端,车抵贷业务因为基本具备这些特点而成为众多P2P网贷平台争夺的焦点。车抵贷业务变现能力较强,可以方便车主随时将车辆转变为资金,这使得汽车成为一种便利的金融资产。但是车抵贷业务也存在着借款人员的道德风险、抵押车辆风险、平台操作不规范等众多问题,为了使车抵贷业务健康持续的发展,车贷平台应当做好完善的风险管理。本文主要从贷前管理的风险识别入手,使用机器学习里的多个算法构建模型对车抵贷业务的违约率进行研究,通过比较各个模型计算出的准确率来找出最适合做车抵贷业务违约率的风险识别模型,帮助P2P车贷行业建立更加完善的风险识别体系。对P2P车抵贷业务做违约率的风险识别研究可以帮助车贷平台提前甄别出风险隐患大的借款者,保护车贷平台与投资者的利益。本文研究的重点是构建针对车抵贷业务违约率的风险识别模型,选取来自微贷网的车抵贷项目数据。首先介绍车抵贷业务的流程、模式并对其进行分析,再介绍车贷平台对车抵贷业务的经营方式,在这些基础之上对车抵贷业务存在的风险进行分析。在构建风险模型的实证研究方面,分别使用基于树模型的决策树、随机森林、极端随机树算法与GBDT+LR算法以及XGBoost算法构建风险识别模型。根据各个模型得出的结果来看,在基于树的三种模型中随机森林的效果是最好的,在信贷领域里使用广泛的GBDT+LR模型效果仅比决策树的效果好,XGBoost模型的效果是最好的。根据XGBoost算法得出的车抵贷项目违约率的影响因素结果来看,抵押车辆的估价、历史还清期数、行驶公里、项目总额的影响程度最大,其次是待还款期数、年龄、预期利率、借款用途、项目期限、购买价格,而工作性质、婚姻状况、性别、收入情况的影响程度是很小的。本文使用机器学习的算法来处理多维度变量的数据,与传统的P2P风控方法相比具有很大的优势。根据研究结果来看P2P车贷平台应当重视数据资源并加强与征信机构合作,利用大数据技术来做风险识别可以避免个人主观因素的影响,有利于车抵贷业务良性的发展。