论文部分内容阅读
P2P网络借贷行业凭借互联网的底层技术突破了传统借贷行业中时间与空间上的局限性,从全球局势看来是对金融体系的有益补充。但是,国内P2P网贷行业“雷暴”不断的现象揭示了该行业仍存在诸多风险,其中行业主体(P2P平台)的信用风险显得尤为突出。因此,结合时代特点和学术方法探索如何实现P2P网络借贷平台信用风险的预警具有一定的学术价值和现实意义。
本文在通过爬虫技术抓取的网页数据基础之上,利用机器学习技术对P2P网贷平台信用风险进行研究。首先,探讨机器学习与P2P平台信用风险的相关理论,为后期的数据研究奠定理论基础;其次,通过相关数据收集、文献整合等方式梳理国内外行业发展历程与现状,奠定本文研究的现实基础;然后,在R语言中编写代码对数据进行预处理、分析以及特征工程,实现对数据集的初步认识与平台信用风险的研究探索;接着,分别构建BP神经网络、支持向量机以及卷积神经网络机器学习预警模型,对平台数据进行模型训练与测试;最后,通过对比分析各个模型预警效果,作出相关评价与政策建议。
通过探索性分析获得多个指标与P2P平台信用风险之间的规律。平台背景、注册资金与实缴资金均是展现平台实力的重要指标,实力越雄厚的平台其信用风险相对越小。另外,平台的信用风险与平台收益率息息相关。研究表明,在一个较小的合理区间内,平台的信用风险会随着平台收益率增加有所降低,但是当超过约10%的合理临界值,平台的高收益可能反而意味着高风险区。同时,债权转让与增信方式从一定程度上均能看做是缓解国人刚性兑付需求的措施,平台越能有效应对由刚性兑付造成的影响,其对应的信用风险越小。
Boruta算法的封装降维方式不单具有简便化和可视化的特点,其筛选出来的特征具有相对客观性,降低了主观选择特征对模型预警效果造成的潜在不利影响,为后期机器学习预警模型在应用中发挥最优性能奠定了重要基础。同时,该算法筛选出来的平均利率、银行存管、ICP认证等21个指标,在行业发展中可重点关注,实现多方面配合管理以帮助P2P网络借贷行业更加适应当前全球金融环境的发展需求。
无论是深度机器学习模型,还是浅层机器学习模型均能实现对平台信用风险的预警。其中,深度机器学习中的卷积神经网络(CNN)整体效果上表现更加优异,其模型性能的稳定性最佳。从而,基于机器学习的平台信用风险预警模型的构建与应用能有效推进P2P网络借贷行业信用风险控制。
本文在通过爬虫技术抓取的网页数据基础之上,利用机器学习技术对P2P网贷平台信用风险进行研究。首先,探讨机器学习与P2P平台信用风险的相关理论,为后期的数据研究奠定理论基础;其次,通过相关数据收集、文献整合等方式梳理国内外行业发展历程与现状,奠定本文研究的现实基础;然后,在R语言中编写代码对数据进行预处理、分析以及特征工程,实现对数据集的初步认识与平台信用风险的研究探索;接着,分别构建BP神经网络、支持向量机以及卷积神经网络机器学习预警模型,对平台数据进行模型训练与测试;最后,通过对比分析各个模型预警效果,作出相关评价与政策建议。
通过探索性分析获得多个指标与P2P平台信用风险之间的规律。平台背景、注册资金与实缴资金均是展现平台实力的重要指标,实力越雄厚的平台其信用风险相对越小。另外,平台的信用风险与平台收益率息息相关。研究表明,在一个较小的合理区间内,平台的信用风险会随着平台收益率增加有所降低,但是当超过约10%的合理临界值,平台的高收益可能反而意味着高风险区。同时,债权转让与增信方式从一定程度上均能看做是缓解国人刚性兑付需求的措施,平台越能有效应对由刚性兑付造成的影响,其对应的信用风险越小。
Boruta算法的封装降维方式不单具有简便化和可视化的特点,其筛选出来的特征具有相对客观性,降低了主观选择特征对模型预警效果造成的潜在不利影响,为后期机器学习预警模型在应用中发挥最优性能奠定了重要基础。同时,该算法筛选出来的平均利率、银行存管、ICP认证等21个指标,在行业发展中可重点关注,实现多方面配合管理以帮助P2P网络借贷行业更加适应当前全球金融环境的发展需求。
无论是深度机器学习模型,还是浅层机器学习模型均能实现对平台信用风险的预警。其中,深度机器学习中的卷积神经网络(CNN)整体效果上表现更加优异,其模型性能的稳定性最佳。从而,基于机器学习的平台信用风险预警模型的构建与应用能有效推进P2P网络借贷行业信用风险控制。