基于树集成模型的P2P网贷平台借款人信用风险研究

来源 :广州大学 | 被引量 : 1次 | 上传用户:l123654123654
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P(Peer to Peer)即表示个人对个人.P2P网贷作为互联金融的子业,是个人与个人之间借助网贷平台直接实现双方借贷交易的业务模式.近年来,P2P网贷行业在国内外发展进行的十分火热,各类模式的网贷平台也随之陆续出现.尤其是在国内,根据网贷之家数据显示,直至2018年年底,P2P网贷平台已经累积达到6000家以上,但是网贷平台同时也爆发出跑路、停业等恶劣现象,其中平台借款人大量出现违约行为会严重影响P2P网贷行业的稳定发展.因此本文对网贷平台借款人信用风险进行重点研究,建立一个快速而有效的网贷平台贷前审核借款人信用风险评估模型,从而促进P2P网贷行业未来的健康发展.本文首先介绍了三种树的集成模型对网贷平台借款人信用风险进行快速有效评估,分别是梯度提升决策树(GBDT)模型、随机森林(RF)模型和极端梯度提升(XGBOOST)模型,然后通过获取人人贷平台散标借款人网贷数据,将预处理完后的数据随机分为原始训练集和原始测试集.由于借款人网贷数据存在不平衡现象,利用Borderline-SMOTE算法平衡化原始训练集后,得到BLSMOTE训练集.在各模型进行建模及预测前,选用5折交叉验证法进行模型参数调优取较优值,分别在原始训练集和BLSMOTE训练集下各模型训练预测得出相应的分类评价指标和运行时间.将各模型的分类评价指标和运行时间作对比,得出结论:在BLSMOTE训练集下,XGBOOST模型和GBDT模型的分类性能有所提高,而RF模型的分类性能略微下降.在原始训练集和BLSMOTE训练集下,XGBOOST的分类性能均比GBDT模型和RF模型要好,其中分类评价指标中的ACC值和AUC值均比后两者大,相应得到的ROC曲线也比后两者要更往左上方(0,1)点处靠拢.XGBOOST模型预测得出FP和FPR(第一类误分率,即将较差还款人误分为较好还款人的比例)均比GBDT模型和RF模型要小.在运行时间上,XGBOOST模型消耗时间最短.因此,本文认为XGBOOST模型是一个快速而有效的网贷平台贷前审核借款人信用风险评估模型,可以为平台管理者提供有效评估和管理的参考价值.
其他文献
一、研究背景周围神经缺损的修复与重建是目前世界性的难题,临床治疗的金标准是白体神经移植,但存在供体来源有限、供区感觉及运动功能受损等弊端,因此探索周围神经损伤修复
随着城市化进程的加快,人们旅游消费需求的转变以及社会主义新农村建设的推进,使我国的农家乐旅游进入了飞速发展时期。作为一种新型的旅游和农民创收形式,农家乐旅游将第一
教育是发展的前提,而教师是教育发展中关键的一环,教师对其教学工作的态度、投入及期望等因素直接决定了教学质量甚至教育事业的发展。对于教育相对普遍落后的非洲来说,在各
近年来,随着户外运动在我国的蓬勃发展,自行车运动作为一种新兴的健身方式在国内各地逐步兴起。一方面,自行车运动具备常规体育活动所能带给人们强身健体、愉悦身心的作用,另
筝,是我国土生土长的一件民族弹拨类乐器,历史悠久,至今已有两千多年,因此现代人习惯在其名字前加一个“古”字,称其“古筝”,以体现它的古老性。它是一件凝聚了中华灿烂文化
史料信息的处理是探索历史、学习历史的重要一环。高中历史教学中的史料信息处理,不仅有利于充分发挥学生的积极性与参与性,更有利于提高学生探究历史问题的能力和养成实事求
赵亚夫先生是我国当代历史教育界的知名专家,投入了大量的心血和精力从事历史教育教学研究,尤其在国外历史教育研究领域最富盛名。他的研究著述,总能紧扣时代脉搏并及时抓住
<正>古时的药铺都喜欢在店堂门口贴上一些既有行业特点,又颇具行业特色,并有一定趣味性的对联,俗称"药联"。其中有的"药联"引经据典,用来增添店堂色彩。如"寿世寿人,吉林春满
本文以宋元绘画中的题款为主要研究对象,试图对宋元时期题款在绘画中的发展概况、艺术成就以及形成原因予以研究。宋元绘画题款艺术在整个题款艺术发展史上占有重要的地位。
随着人口老龄化的加剧,老年人口占总人口的比重越来越高,中国家庭结构已转变为以“4:2:1”家庭为主,家庭养老已不能满足现阶段的养老需求,养老方式转变成为必然。另一方面,老年