论文部分内容阅读
随着互联网金融的快速发展,如何通过高风险客户评估来降低借贷风险,一直以来都是互联网借贷的关键问题;使用回归分析等计量方法对借款人种类繁多之信息进行推断,从而对其违约概率作出预测,不仅降低了风控的成本、更提高了借贷的效率,进而大大增加了人们对互联网金融的信心。然而,自国外发薪日贷款(payday loan)演变而来的我国现金贷产品,其贷款额度更小、贷款周期更短、面对的贷款人群信用空白度更高,如何快速有效的收集和预判此一领域的高危客户,对违约风险预测和互联网风控提出了新挑战。目前这一领域的研究主要集中在体系和政策等宏观层面,而在微观层面因行业起步晚、发展时间太短,行业研究、政策规范及数据积累都十分有限,实证研究就更少;西方虽有一些针对payday loan的研究,但我国互金市场、经济环境和用户群体属性有其历史独特性,因而现金贷风控相关的信息更加离散、行业可供借鉴的研究更少。因此,在面临这些新场景时既有的风控方法和模型工具有待深入实践、回归分析方法的有效性和适用性如何仍需实际数据验证,在资源有限的情况下聚焦哪些变量可以有效识别现金贷借款人的违约概率,还缺少深入的研究。本文通过文献分析法和比较法研究了互金的国内外发展和风控理论,聚焦信用违约这一核心风险进行深入探讨。评估工具上,采用分类比较法对各种违约模型和评估工具进行了集成和比较;风控产品上,对国内大数据风控企业和风控产品进行了与时俱进的详细调研和总结;企业实践上,对互联网小贷之P2P、特别是现金贷这一互金新领域近两年的新演变和行业发展中的新问题做了专题整理调研,以保持资料的实效性;并在前述基础上通过实地调研具体介绍了 KH平台内部的运营、客群、产品、流程、风控体系等情况,以求对现金贷宏观行业和微观企业的信息可以有一个“一站式梳理”。在具体数据与违约评估方面,本文以KH现金贷公司内部2017年Q1~Q3的数据为处理对象,首先采用归纳聚类法对原始字段加以转化、采用随机抽样法进行数据抽样、采用对照法进行数据分组;然后以定性分析法和定量分析相结合,对现金贷客群画像进行多维度透视,并采用附带因子分析和Logit变换的二分类逻辑回归方法对1560组数据进行了定量分析并得出违约概率预测模型;该模型经检验拟合良好,其对样本外数据的预测精度达到84.8%。结论表明:(1)与一般借贷相比,还款意愿类指标和体现还款人稳定程度类的指标(如网上行为异常程度、信用得分),与违约概率相关性更显著。(2)还款能力类指标与违约概率存在相关性,但显著性一般。(3)借款利率和借款用途的相关性较弱,表明现金贷借款人更注重流动性。(4)风控模型的持续改善离不开内外部因素和数据、模型、系统、人才、机制等多方面的协同。本文由此认为,一方面现金贷的规范发展离不开市场的有效监管、行业自律和数据能力共享,特别是共贷数据的平台化和共享化,将能够大大减少现金贷平台的坏账率,为每一个现金贷公司的风控赋能;另一方面,企业过去的“暴利覆盖坏账”模式不可持续、必须加速转型,做好产品设计和专业风控,才能在合规与盈利之间建构起平衡,真正为市场提供满足金融需求的产品,本文的实证研究即为企业内部风控模型的改进提供了借鉴。此外,本文基于因子分析的Logistic回归方法和数据资料来源于企业实践、资料实证性强,对现金贷风控的研究构建了必要的数据框架,文末也提出的一些具有指导意义的转型创新经验,可以为后来者研究这一互联网金融新业态提供微观案例。