基于数据挖掘的P2P网络借贷信用风险评估研究

来源 :安徽财经大学 | 被引量 : 0次 | 上传用户:kentxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何解决借贷双方之间的信息不对称问题是决定借款是否成功的关键。自2007年6月国内第一家纯线上运作P2P网络借贷平台—拍拍贷(ppdai.com)成立以来,作为一种以互联网技术为核心的创新型金融模式,为我国中小微企业融资提供了一种新的、更加便捷的方式,从某种意义上缓解了中小微企业融资途径单一化问题。同时也为投资者创造了一个新的投资机会,使社会上的闲散资金更加高效地流转。借贷双方依靠P2P平台完成了以下借贷交易过程:信用评级、信息配对、利率协调、合同签订以及资金转移,而平台利用现代信息采集手段快速获得海量数据,然后运用云计算等科学技术进行大数据处理,根据分析结果评估风险大小和确定借款人的信用等级,在此基础上实现借贷的顺利完成。目前,P2P网络借贷的交易规模正在快速增长,参与人员也逐渐趋于非金融化。P2P网络借贷平台作为借贷的交易场所面临着各种风险,但由于市场中存在大量资金需求以及缺失行业准入门槛,平台的运营风险不断地积累,进而导致大量的平台倒闭,甚至是一些看上去运营情况不错的平台也有可能突然就倒闭或跑路了。其中,最大的风险就是借款人的信用风险,而相较于银行等传统金融机构日趋成熟的风险控制措施,作为刚刚兴起的新事物,国内目前还比较缺乏关于借款人信用风险的评估新方法。因此,能否有效地评估借款人的信用风险,节约交易成本,提高交易效率,促进信用资源优化配置,无论是对于投资者还是监管层都有着非常重要的意义。本文从对国内P2P网络借贷信用风险评估研究现状及存在的问题分析出发,梳理了目前国内外P2P网络借贷模式以及比较分析其中存在的风险,重点研究了以下四种主要运营模式:信用中介模式、担保模式、类资产证券化模式以及风险准备金模式。与国外比较后发现,国外P2P平台收集借款人信用信息大多数来自专业的第三方信用评级机构,而我国由于征信系统的不完善导致缺乏第三方信用数据,信用风险评估困难,进而本文提出基于数据挖掘方法来建立P2P网络借贷信用风险评估模型的想法。主要工作包括:首先,收集了LendingClub平台2016年的贷款记录,在预处理和异常值剔除后得到一个不平衡的数据集。由于平衡的数据集能提高分类性能,所以再分层抽样后得到10个平衡的数据集。在此基础上,从全部变量中去除不相关和冗余变量并分成了四大类指标,作为P2P网络借贷信用风险评估模型的备选变量。最后,运用数据挖掘方法对P2P网络借贷进行了实证研究,主要运用了朴素贝叶斯、IBk、决策树、二项Logistic回归以及支持向量机五种典型的算法。优化后得到了具有较好预测能力的结果,并针对研究结论提出加强及完善我国P2P网络借贷的相关建议。
其他文献
2008年全球金融危机后,全球处于低利率环境,随着经济全球化和区域一体化的不断深化,中国利率化进程不断完善,其他国家的负利率政策的外溢效应亦会对中国经济和中国货币政策产
通过调查地处夏热冬冷地区的重庆市居住建筑墙体保温市场现状,发现阻碍节能市场发展的主要原因是市场机制不完善,对此提出解决建议方案,以期能更好的发挥市场机制的基础性作
位于酶分子活性位点(又称活性中心)附近的环结构对酶促反应特性具有重要影响.本实验室先前在宇佐美曲霉Aspergillus usamii中发现了一种新的5家族β-甘露聚糖酶Au Man5A.通过
笔者在《唐诗宋词选读》的学习中,开发了其中的吟诵教学资源,在实践中,整合吟诵的网络、校本、地方等资源,以《苏幕遮》《长相思》《月下独酌(其一)》为例,感受了学生在学习
应用体外细胞培养及 RT- PCR(reverse transcription PCR)分析了新疆一枝蒿总黄酮类作用后肝癌细胞 (肝癌、ATCC QGY- 770 1 )中凋亡基因 p53、Fas及细胞增殖基因 bcl- 2的表
基于基因组序列数据库挖掘新酶的技术,从白色念珠菌Candida albicans基因组中克隆了一条新型醇脱氢酶(CADH)基因,并在大肠杆菌Escherichia coli Rosetta(DE3)中表达。为克服游离
目的测定瓯海区市售大米中的重金属元素铅、镉、汞,评估其污染状况,并进行健康风险评价,为保障食品安全提供科学依据。方法利用石墨炉原子吸收分光光度法测定铅和镉,利用原子
根据技术接受模型TAM和电子商务信任相关理论,本文提出了基于TAM的在线信任模型,进而采用结构方程模型对理论模型和研究假设进行了实证分析。分析结果表明,用户对网站的易用
介绍了直插式水质监测仪的工作原理及优点,指出该设备可以对水流、压力和多个水质参数进行同步实时监测,并通过采用最新的第三方通讯技术,将所有指标的数据实时传送到世界上