基于数据挖掘方法的网贷用户特征分析及逾期预测

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:ALFU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网在全球的普及及广泛应用,互联网金融也伴随着互联网技术的不断提升而迅速发展,从余额宝到P2P网贷,网络贷款平台如雨后春笋迅猛发展起来。但是由于我国的网络信贷行业发展时间很短,个人信用评级体系不健全等问题,使得P2P网络借贷平台面临比较大的由于逾期带来的信用风险,如何控制由于借款人逾期带来的信用风险是P2P网络借贷平台持续发展的关键。因此利用网络借贷平台海量的交易数据,使用统计分析和数据挖掘方法分析借款用户特征和运用风险评估方法对单笔贷款中借款人是否逾期建立预测模型,了解网贷平台借款群体的特征,发现平台应该重点审查的项目,采取针对性的措施从而提高网贷平台收益,保证网贷平台的优质化运营十分重要。本文主要研究了统计方法和数据挖掘技术在P2P网贷平台的用户特征分析和逾期预测方面的应用。首先,本文使用网络爬虫方法抓取了某P2P网络平台的真实用户数据,随机抽取了1319条满标的借款数据,使用PAM聚类方法对借款用户进行聚类,研究网贷平台借款者的个人特征,为网贷平台识别客户,发现优质客户提供参考。接着,基于用户特征分析提取的借款用户的典型特征,并使用工程学中信息增益率的定量方法进行特征选择。其次,使用信用评估方面应用广泛的统计方法Logistic回归和数据挖掘方法神经网络模型、支持向量机模型分别建立单笔贷款中借款者是否逾期的预测模型,分析模型的准确率、稳定性和可解释性。发现神经网络模型具有很好的预测精度,但是模型稳定性和可解释性较差;而Logistic回归模型虽然具有较好的稳定性但是其精度较数据挖掘方法差,因此为了得到精度较高并且稳定性较好的逾期预测模型,建立神经网络和Logistic回归模型的串行逾期预测模型;最后对我国网络借贷行业的用户特征进行总结,发现优质客户和潜在的逾期客户,并对逾期问题提出合理建议。
其他文献
大数据、人工智能、移动互联、云计算、物联网等新一代信息技术推动着经济的飞速发展,财务信息系统特别是用于财务分析与风险管控的智能财务分析与决策系统应用对于企业具有
自主学习是人们获取知识的一种重要方式。目前,很多高校都搭建了自主学习系统,且随着应用的日渐深入,系统中的学习资源数量与日俱增,使得学生在自主学习过程可能要花费很多时
旅游产业提质增效是经济新常态下旅游科学研究的重要问题之一。引入演化经济地理学及其“结构—过程”的分析视角研究区域旅游产业效率时空演化过程及驱动机制,具有重要的理
农技推广是科学技术转化为现实生产力的桥梁和纽带,是国家支持农业、实现兴农富民的重要手段,在科技成果的转化中起着重要的"二传手"作用。县、乡农业技术推广部门是农业技术推
提要:新课改下高中数学教学一定要解放思想,更新观念,注重教学过程中学生的体验,转变之前填鸭式教学方法,教师要引导学生自主构建知识体系,注重学生个性发挥,注重讲授数学思想和方法
音乐能够让人心旷神怡,能够给人带来快乐的感觉,也能够让人体验到轻松愉快感。在学校教学中,音乐教学的魅力不仅是要传授给学生音乐的知识和技能,更重要的是要让学生在忙碌的
法律可以分为实体法与程序法,它们之间具有密切的关系,准确理解它们之间的关系,清楚它们之间的分类及其价值,具有重要的意义。对此,不仅通过分析马克思关于实体法与程序法的
在新的发展态势下,“一带一路”倡议已成为指导我国教育、经济、文化、政治等领域发展的核心战略,立足于此,我们既迎来了新的机遇,又必然会面对新的挑战。聚焦高职院校以培养
融资性托盘交易逐渐走入市场,由于是新兴民间融资活动,游离于金融监管之外,所以易扰乱金融市场秩序。基于对融资性托盘交易和相关裁判文书的研究,总结探讨该类交易所涉合同的