论文部分内容阅读
P2P网贷起源于民间借贷,在互联网技术的推动下,P2P网贷开始在一些发达国家迅速发展起来。2007年P2P网贷传入中国,很快在中国这片土地上成长壮大起来。经过多年的探索与实践,P2P网贷已经逐渐得到各行各业的认可,并吸引了大量用户。然而我国征信体系建设较西方国家明显滞后,相关监管条例仍不完善,且平台自身风控能力和内部控制能力较弱。因此我国P2P网贷行业发展势头虽然迅猛,但平台跑路、倒闭、提现困难等问题时有出现。先以数据挖掘理论与风险评估作为立足点,借鉴了国内外相关文献和书籍,围绕运营能力、发展潜力、平台素质、盈利能力四个方面构建P2P网贷平台风险评价指标体系。由于高风险平台样本数量过低,样本存在严重的不平衡问题,因此使用SMOTE算法平衡样本数据,令高风险平台与非高风险平台占比大致相同。接着使用三种数据挖掘方法,logistic回归、决策树、支持向量机分别建立风险评价模型,并运用十折交叉验证和混淆矩阵法,将十次运算结果的平均值作为对三种评价模型准确性的评估。实证结果表明,各评价模型的精度由高到低为:CART决策树>RBF支持向量机>Logistic回归,总体看CART决策树模型更为稳健。本文在模型建立过程中,使用平台的真实数据,对测试集样本进行预测。三种模型预测精度都较高,特别是CART决策树模型,评价结果可以为P2P网贷风险评估提供参考。接着对目前尚未出现严重问题的平台进行风险预警研究,依据指标的全面性、可操作性、灵敏性和动态连续性的原则,构建网贷平台风险预警指标体系。将主成分分析与改进的KLR信号分析法相结合,选取277个平台为样本,对收集的数据汇总、处理,代入模型进行运算,得到各平台的风险排名和风险预警状态。之后将预警结果代入BP神经网络进行训练,并对测试集进行预测。实证结果表明训练模型的预测结果较好,预测值与实际值误差较小、可信度较高,预警结果较为合理。本文研究的重点和难点是将数据挖掘方法运用到P2P网贷平台风险评价中,构建风险评价体系,对P2P网贷平台进行风险评估与预警。基于上述实证分析结果和结论,本文在最后对我国P2P网贷行业的健康持续发展提出了建议:(1)加强网贷行业监管,增加网贷行业透明度(2)逐步完善广泛的个人征信体系,建立网贷行业综合数据库(3)建立P2P网贷风险预警管理体系,将风险预警法规化。