论文部分内容阅读
根据网贷之家梳理的84家网贷平台数据,截至2019年6月份,仍然有21家的网贷平台项目违约率超过4%,其中有12家的项目违约率大于10%。网贷平台的违约率较高,主要是因为网贷平台缺乏有效的借款人信用识别手段,造成骗贷事件的屡屡发生。另外,网贷平台无法对贷款做出准确的定价,出现“劣币驱逐良币”现象,造成优质借款人的流失。因此,网贷平台采取合适的信用评估技术,并对网贷做出准确的定价显得尤为重要。当下大数据挖掘技术日渐发展,备受互联网行业的追捧,主流的数据挖掘技术能否应用于金融行业,对网贷借款人的信用风险进行评估?在这些数据挖掘方法中,哪种方法的信用风险预测效果最好?除此之外,当下网贷平台采用的固定定价方法是否能反映借款人的信用风险?固定定价法与风险资本回报率Risk-Adjusted Return On Capital(以下简称RAROC)对利率定价的方法相比孰优孰劣?本文的研究主要分为两部分:本文研究的第一部分从网贷信用风险预测模型预测效果的角度,根据人人贷平台的交易数据,利用Logistic、贝叶斯网络、C5.0决策树、神经网络、随机森林、支持向量机等6种大数据挖掘算法对网贷借款人的信用风险进行评估。通过20次交叉检验的方法利用准确度、Kolmogorov-Smirnor(以下简称KS值)、Area under the Curve of ROC(以下简称AUC)、Gini系数和Brier Score(以下简称BS值)对比分析模型的预测效果,选出一种性能较为优异的信用评估模型。本文研究的第二部分基于研究的第一部分中最优模型信用评估的结果,利用RAROC方法对贷款进行重新定价,分析网贷平台原有定价方式的合理性。研究发现,利用6种数据挖掘方法均可以有效地评估网贷借款人的信用风险,可以发现当借款人信用等级提高时,网贷的违约率均明显下降。其中,神经网络模型信用风险评估的效果最佳,其次是C5.0决策树,再次是Support Vector Machine(以下简称SVM)。研究发现,工作认证、公司规模、借款金额、借款用途、公司类型、省份、公司所在行业、学历水平、工资水平和工作年限这10种变量对违约的影响较大。特别地,本文发现工作认证可以避免贷款发生违约。研究发现,RAROC方法定价的利率相较于原利率在分布上存在明显的差异。目前,人人贷网贷平台实行固定利率定价方法,网贷的利率与其面临的风险相比,还不能反映出它的收入回报率。对于网贷存在的潜在风险,现有定价方法缺乏更合理的衡量方法和适当的补偿。本文主要的创新点:1.本文研究的第一部分,从网贷信用风险预测模型预测效果的角度,以人人贷网贷平台的交易数据为研究对象,爬取了人人贷2015年10月03日到2016年11月09日共136932条交易数据,为了研究的可行性,本文从中选取了借款期限为24个月,借款人借款次数为1次的9455条贷款数据作为样本进行研究,针对借款人的违约风险,构建了6种信用风险评估模型,对比分析这6种模型的预测性能,以及对影响借款人违约率的因素进行了研究。2.本文研究的第二部分,从网贷平台原有定价方式合理性的角度,基于研究的第一部分中最优风险预测模型——神经网络模型,将RAROC方法与当下网贷平台所采用的固定定价方法进行对比分析,研究RAROC方法是否优于现行的固定定价法,是否可以体现体现贷款收益与风险的匹配。3.本文研究采用跨学科的研究视角,将大数据挖掘技术与金融风险计量方法相结合,重点对网贷平台的信用风险评估技术和平台现行定价方式的合理性进行研究,实现了理论研究和理论成果应用的相结合,并提出一种可行性较高的网贷信用风险防范方法,有助于互联网金融企业建立网贷信用风险管理机制,防范互联网金融风险。