论文部分内容阅读
摘要:近年来P2P行业迎来井喷式发展,它对于我国金融体系的完善,中微企业资金缺口的弥补,以及个人现金流的补充具有重要的意义。但随着行业竞争的白热化,P2P行业的各种风险也在不断显露。自2016年开始,我国P2P开始频繁爆出庞氏骗局、跑路等事件,且涉案金额巨大,社会影响极其恶劣。我国目前金融监管从业者人数远远少于金融机构,且职权不清晰导致很难发挥真正职能。基于该背景,力图建立一个利用最易获得公开数据进行有效预警的模型,以帮助监管者对海量金融机构完成低成本有效筛查。
关键词:公开信息;网络借贷平台;预警
中图分类号:D9文献标识码:Adoi:10.19311/j.cnki.1672-3198.2019.01.069
1引言
國务院总理李克强2014年9月在夏季达沃斯论坛上公开发出“大众创业、万众创新”的号召,伴随着“双创”一词开始走入大众视野的,还有“互联网金融”。在第十二届全国人民代表大会第三次会议上,国务院总理李克强首次公开提及互联网金融,这是国家政府部门首次公开提及互联网金融行业。自此之后,P2P网贷行业在我国进入了野蛮生长的时期。自2012年以来每月新增的P2P平台数量逐步上升,在2014-2015年达到了巅峰,最高一个月新增平台数量达到256家,随后新增平台数量逐步减少,网贷平台总数也从2017年开始逐步走向稳定。
巴菲特说过:“只有退潮后,才知道谁在裸泳”,随着互联网金融热的退潮,中国经济将呈L型走势的主基调的确定,热钱开始逐步退出网贷市场,国家扶持相关扶持政策也开始收紧,问题网贷平台的数量开始逐步攀升。在最严重的2015年7月,一个月爆出的问题平台就有171家之多,随后问题平台的数量开始逐步减少,但自2017年12月以来问题平台的数量大有抬头之势,2018年7月被爆出来的问题平台就多达131家。在冰冷的数据背后,是无数个因为平台跑路而支离破碎的家庭以及国家公安经侦部门极大的破案压力。
本文基于网络公开信息选取13个指标作为P2P网络平台的风险预警指标体系,建立包括输入层、隐含层和输出层三丰的BP神经网络预警模型。运用Python软件对建立的神经网络进行训练,在期望输出值和样本输出值之家误差缩小到标准范围后,预警模型建立成立。
2建立基于公开信息的风险预警模型的必要性
信息技术的高速发展和应用,已经让人们的生活方式发生了巨大的改变。金融本就是利用海量信息实现对资金最有效的分配,伴随着对互联网信息的使用,金融产业本身必然迎来巨大的变革。在这场变革之中,金融不再仅仅属于纽交所里西装革履的券商们,信息技术打破了金融参与的门槛,如今人人都能参与到这一场资金的饕餮盛宴中。就如同现在大家已经接受了使用支付宝消费一般,网贷平台也必将逐步逐步褪去“骗子”、“赌博”、“薅羊毛”等反面标签,逐步成为人们理财的一个选择。面对网贷平台风险的复杂多变,建立起有效的网贷平台风险预警模型是非常必要的。
2.1实时监测的必要
网贷平台的风险并不是静止不变的,然而人为对大量网贷平台的检测不但低效而且是被是对公共资源的极大浪费。只有运用网络预警模型,才能实现网贷平台的实时监控,以最小的人力物力完成对平台风险的初步排查。
2.2个人使用的必要
网贷平台归根结底要对接到个人,大量的投资者在选择网贷平台时,都会下意识的自主判断网络平台的风险程度。但是由于专业知识的缺乏,大部分人只能通过在贴吧论坛发帖或者网络搜索等方式来征询意见做出判断。而基于公开信息的预警模型可以帮助广大缺乏专业知识的投资者们在投资时做出更为准确的判断。
2.3快速预警的必要
随着我国网贷行业市场出清的加快,一些网贷平台多有趁火打劫之势。和典型的网贷暴雷公司持续时间较长,金额特别巨大不同。在杭州的网贷平台跑路潮中很明显可以看到很多公司上线时间不过几个月,这些公司就是趁着当前经侦部门压力大精力不够的空隙,大有打一枪换一炮骗了一笔就跑的趋势,由于金额相对来说不是很大反而增加了被骗投资者的维权难度。因此本模型的使用可以迅速对还没有太多历史记录的新公司进行预警,把这种“诈骗游击战”的不良势头扼杀在萌芽状态。
3网贷风险预警指标体系的设置
3.1国内外网贷机构差异
在英美等西方发达国家,P2P平台只是一个单纯的信息中介,不参与任何借贷的资金交易,对投资人的损失也没有任何赔付的责任。因为英美等发达国家拥有较为完整的个人征信体系,投资人可以根据借款人的信用状况及拥有财产等自由竞价,确定合适的资金回报率。此外,英国等国拥有较为完善的监管政策和规范,拥有专门的部门对P2P进行监管,全责分明。例如美国的证券交易委员会,英国的锦市场行为管理局和P2P金融协会,规范的政策和完善的监管有效控制了P2P在上述国家的风险。
在国内虽然征信体系在逐步普及,凡事总体并不健全,且P2P目前并无权限和国家征信体系对接,借款者风险很难得到充分客观的暴露,因此投资者往往开始寻求P2P平台的“靠谱”、“有保障”。这也使得P2P平台不得不通过宣扬自己的“有保障”、“国资背景”、“自有保障金”等来增加自身的信用。这使得P2P平台不过是成为了另一种银行,形成了当出现一笔小业务违约时,为了平台本身的声誉P2P公司会选择掩盖过去,日积月累最终走向不得不跑路的恶性循环。我国目前的资管新规已经明确表示要打破刚信兑付,但是借款人接受投资可能会亏本这一点还需要一定的时间。
3.2网贷平台风险因素
网贷平台的风险可以从系统风险和非系统风险两个层面进行分析,结合网贷平台自身特点,筛选出最能代表性的风险因素。
网贷平台的系统性风险主要有政策风险、法律风险和经济周期风险。犹豫政策上的宽松法规的不健全等,导致平台数量疯长并引发恶性竞争,甚至会出现劣币驱逐良币的情况。另外经济周期的影响也是无法忽视的,随着全球经济的转冷反全球化趋势的越发严重,很多大型金融机构都无法支撑何况新兴的网贷平台。但本文目标更多是从微观角度检测企业风险,因此暂不考虑经济周期。 网贷平台的非系统风险有信用风险、品牌风险、技术风险等。为了尽可能争取客户很多平台会有意放宽放款条件,这导致了大批老赖的进入以及部分投机分子的薅羊毛行为。有证据显示,现在很多从平台拿到贷款的人有意在网上制造平台负面信息,以期待平台倒闭后自己也不用还清贷款,这些行为无疑大大增长了平台自身的风险。如果出现了技术性问题导致官网无法打开或资金无法提现等情况很容易触及投资者敏感的神经,造成挤兑现象。
3.3预警模型指标设立
但是值得注意的是,在网贷相关法律法规还并不完善的当下,相关数据的获取难度较高且真实程度也值得怀疑,因此本文利用大数据思维,主要利用在互联网上公开的人人都可以轻松得到的信息作为预警模型的输入指标,通过指标内部的非线性逻辑来反应一家平台的风险程度。一个恶性非法的网络借贷平台必然会尽可能的扩大自身的影响力、同时做好反调查准备,在监管单位有所反应之前圈到足够的钱,这种行为很难不在网络上留下痕迹。因此,社会公开信息指标的引入可以有效弥补官方观数据的不足及真实性问题,增强预警模型的可信度和有效性。
综上所述,网贷平台风险评估体系如表1所示,各指标的原始数据如表2所示。
4BP神经网络的设计
4.1BP神经网络概述
BP神经网络中BP是back propagation的缩写,译为反向传播,因此BP神经网络又称误差反向传播神经网路,是1986年由Rumelhart和McClelland为首的科学家提出的概念。BP神经网络通过采用误差逆向传播算法,由程序自动学习演算使得误差降至最小值,以得到最接近真实情况的权值。
BP神经网络属于多层感知机,是由多个感知机层全连接组成的前馈神经网络,全连接是指层上任一神经元与邻近层上的任意神经元之间都存在连接,该模型拥有出色的处理非线性问题的能力。 BP神经网络具有输入层,隐含层和输出层,理论上已经证明一个隐含层的BP神经网络可以实现任意非线性映射,可以满足绝大部分场合的需要。
4.2BP模型神经节点设置
本文采用的是标准结构的BP神经网络,包括一个输入层、一个隐含层和一个输出层。其中,输入层的节点数为13,由输入指标的数量决定;输出层的节点数为1,其中健康平台的平台值为0,问题平台值为1。
隐含层的节点数选择和输入层神经单元以及输出层神经单元数量有关。但目前还没有很好地确定依据,根据任务来确定隐含层节点的数量是比较困难的。因此,目前还是主要以过往的成功经验为依据,一般参考的经验公式是:L=log2n,n为输入节点数,因此隐含层的节点数为3。
4.3BP模型参数设置
再确认了BP神经网络模型的输出层,隐含层和输出层节点后,还要确定神经网络的传输函数和训练目标等参数。非线性的传递函数主要分为Log-sigmoid和Tan-sigmoid两种。其中Log-sigmoid型输入值可取任意值,输出值范围为(0,1),Tan-sigmoid型输入值可以取任意值,输出值范围为(-1,1);线性传递函数pureline的输出和输出可以取任意值。因为本文输出值都为正数,因此输入层传播函数为Log-sigmoid函数,输出层传播函数选择pureline函数,可接受的误差标准为ε= 0.1,训练次数为100000,学习速率为0.2,动量因子为0.1。
5面相Python的BP神经网络的训练和检验
本文综合参考网贷之家等多个网贷平台评级网站,综合考虑选择11家优质网络平台作为低风险样本,同时选择6家最近刚刚暴雷的平台作为高风险样本。并从中随机抽取两家低风险两家高风险作为检验样本,其余13家为训练样本。网络的训练和检验都通过Python来完成。通过整理可以得到一个17×13的矩阵,为取消各指标之间的数量级差别,从而最大程度降低预测误差,将原始数据归一化处理。归一化处理后训练模型的输入值如表3所示,检测模型的输入值如表4所示。
对于已经训练完成的BP网络模型,训练输入值对建立的BP网络进行检测,输出结果如表5所示。
根据检测结果,检验输出和期望输出值非常接近,准确率达到了100%,两者数据误差满足误差要求。因此,建立的BP神经网络模型有较好的风险评估能力,可用来对网贷行业进行监测,达到风险预警的目的。
6研究结果
构建一个科学有效的网贷平台风险预警模型,可以快速对网贷平台进行初步排查,尽早识别和预警高风险网贷平台,已采取风险防范和化解措施。传统的数理模型大多通过数理统计、逻辑回归等方进行预测,这并不适用于网贷平台这一新型金融模式的风险预警上。另外传统模型也过度于依赖于历史官方统计数据,但是网贷平台相关法规的不完善,平台自身可以通过调整统计端口等方法肆意修改数据,从而造成预警模型的失灵。本文大量采用网络公开数据,这是网贷平台无力修改的,虽然不能直观的反应平台风险状况,但是数据本身的真实性反而能够保证预警模型的科学有效。另外,由于公开数据的获得无门槛,从而大大降低了模型使用难度。神经网络的优点就是反应数据之间非直观的复杂联系,因此本文大胆使用公开数据,该模型甚至可以成为普通民众对网贷平台的风险监测工具,若能得到大范围使用,必将倒逼网贷平台主动走向规范化正规化,让网贷平台主动走到监管的笼子里,从而让杜绝大面积平台暴雷,实控人跑路,投资人上访的不良事件。
参考文献
[1]谢平,邹传伟.互联网金融模式研究[J].金融研究,2012,(12).
[2]王峥.我国互联网金融的风险分析及防范措施[J].时代金融,2014,(8).
[3]曹一.论加强P2P网络借贷平台的监管[J].金融监管,2011,(4).
[4]陈朝晖,张艳芳.基于BP神经网络的商业银行风险预警模型研究[J].福建商业高等专科学报,2011,(2).
[5]Tam KY. Neural Network Models and the Prediction of Bank Bankruptcy [J]. Omega,1991,(5).
[6]杨群华.我国互联网金融的特殊风险及防范研究 [J].金融科技时代,2013,(7) .
[7]郭瑩莹.国内外金融危机预警模型述评[J].科学决策,2013,(10).
[8]张玉梅.P2P 小额网络贷款模式研究[J]. 生产力研究,2010,(12).
关键词:公开信息;网络借贷平台;预警
中图分类号:D9文献标识码:Adoi:10.19311/j.cnki.1672-3198.2019.01.069
1引言
國务院总理李克强2014年9月在夏季达沃斯论坛上公开发出“大众创业、万众创新”的号召,伴随着“双创”一词开始走入大众视野的,还有“互联网金融”。在第十二届全国人民代表大会第三次会议上,国务院总理李克强首次公开提及互联网金融,这是国家政府部门首次公开提及互联网金融行业。自此之后,P2P网贷行业在我国进入了野蛮生长的时期。自2012年以来每月新增的P2P平台数量逐步上升,在2014-2015年达到了巅峰,最高一个月新增平台数量达到256家,随后新增平台数量逐步减少,网贷平台总数也从2017年开始逐步走向稳定。
巴菲特说过:“只有退潮后,才知道谁在裸泳”,随着互联网金融热的退潮,中国经济将呈L型走势的主基调的确定,热钱开始逐步退出网贷市场,国家扶持相关扶持政策也开始收紧,问题网贷平台的数量开始逐步攀升。在最严重的2015年7月,一个月爆出的问题平台就有171家之多,随后问题平台的数量开始逐步减少,但自2017年12月以来问题平台的数量大有抬头之势,2018年7月被爆出来的问题平台就多达131家。在冰冷的数据背后,是无数个因为平台跑路而支离破碎的家庭以及国家公安经侦部门极大的破案压力。
本文基于网络公开信息选取13个指标作为P2P网络平台的风险预警指标体系,建立包括输入层、隐含层和输出层三丰的BP神经网络预警模型。运用Python软件对建立的神经网络进行训练,在期望输出值和样本输出值之家误差缩小到标准范围后,预警模型建立成立。
2建立基于公开信息的风险预警模型的必要性
信息技术的高速发展和应用,已经让人们的生活方式发生了巨大的改变。金融本就是利用海量信息实现对资金最有效的分配,伴随着对互联网信息的使用,金融产业本身必然迎来巨大的变革。在这场变革之中,金融不再仅仅属于纽交所里西装革履的券商们,信息技术打破了金融参与的门槛,如今人人都能参与到这一场资金的饕餮盛宴中。就如同现在大家已经接受了使用支付宝消费一般,网贷平台也必将逐步逐步褪去“骗子”、“赌博”、“薅羊毛”等反面标签,逐步成为人们理财的一个选择。面对网贷平台风险的复杂多变,建立起有效的网贷平台风险预警模型是非常必要的。
2.1实时监测的必要
网贷平台的风险并不是静止不变的,然而人为对大量网贷平台的检测不但低效而且是被是对公共资源的极大浪费。只有运用网络预警模型,才能实现网贷平台的实时监控,以最小的人力物力完成对平台风险的初步排查。
2.2个人使用的必要
网贷平台归根结底要对接到个人,大量的投资者在选择网贷平台时,都会下意识的自主判断网络平台的风险程度。但是由于专业知识的缺乏,大部分人只能通过在贴吧论坛发帖或者网络搜索等方式来征询意见做出判断。而基于公开信息的预警模型可以帮助广大缺乏专业知识的投资者们在投资时做出更为准确的判断。
2.3快速预警的必要
随着我国网贷行业市场出清的加快,一些网贷平台多有趁火打劫之势。和典型的网贷暴雷公司持续时间较长,金额特别巨大不同。在杭州的网贷平台跑路潮中很明显可以看到很多公司上线时间不过几个月,这些公司就是趁着当前经侦部门压力大精力不够的空隙,大有打一枪换一炮骗了一笔就跑的趋势,由于金额相对来说不是很大反而增加了被骗投资者的维权难度。因此本模型的使用可以迅速对还没有太多历史记录的新公司进行预警,把这种“诈骗游击战”的不良势头扼杀在萌芽状态。
3网贷风险预警指标体系的设置
3.1国内外网贷机构差异
在英美等西方发达国家,P2P平台只是一个单纯的信息中介,不参与任何借贷的资金交易,对投资人的损失也没有任何赔付的责任。因为英美等发达国家拥有较为完整的个人征信体系,投资人可以根据借款人的信用状况及拥有财产等自由竞价,确定合适的资金回报率。此外,英国等国拥有较为完善的监管政策和规范,拥有专门的部门对P2P进行监管,全责分明。例如美国的证券交易委员会,英国的锦市场行为管理局和P2P金融协会,规范的政策和完善的监管有效控制了P2P在上述国家的风险。
在国内虽然征信体系在逐步普及,凡事总体并不健全,且P2P目前并无权限和国家征信体系对接,借款者风险很难得到充分客观的暴露,因此投资者往往开始寻求P2P平台的“靠谱”、“有保障”。这也使得P2P平台不得不通过宣扬自己的“有保障”、“国资背景”、“自有保障金”等来增加自身的信用。这使得P2P平台不过是成为了另一种银行,形成了当出现一笔小业务违约时,为了平台本身的声誉P2P公司会选择掩盖过去,日积月累最终走向不得不跑路的恶性循环。我国目前的资管新规已经明确表示要打破刚信兑付,但是借款人接受投资可能会亏本这一点还需要一定的时间。
3.2网贷平台风险因素
网贷平台的风险可以从系统风险和非系统风险两个层面进行分析,结合网贷平台自身特点,筛选出最能代表性的风险因素。
网贷平台的系统性风险主要有政策风险、法律风险和经济周期风险。犹豫政策上的宽松法规的不健全等,导致平台数量疯长并引发恶性竞争,甚至会出现劣币驱逐良币的情况。另外经济周期的影响也是无法忽视的,随着全球经济的转冷反全球化趋势的越发严重,很多大型金融机构都无法支撑何况新兴的网贷平台。但本文目标更多是从微观角度检测企业风险,因此暂不考虑经济周期。 网贷平台的非系统风险有信用风险、品牌风险、技术风险等。为了尽可能争取客户很多平台会有意放宽放款条件,这导致了大批老赖的进入以及部分投机分子的薅羊毛行为。有证据显示,现在很多从平台拿到贷款的人有意在网上制造平台负面信息,以期待平台倒闭后自己也不用还清贷款,这些行为无疑大大增长了平台自身的风险。如果出现了技术性问题导致官网无法打开或资金无法提现等情况很容易触及投资者敏感的神经,造成挤兑现象。
3.3预警模型指标设立
但是值得注意的是,在网贷相关法律法规还并不完善的当下,相关数据的获取难度较高且真实程度也值得怀疑,因此本文利用大数据思维,主要利用在互联网上公开的人人都可以轻松得到的信息作为预警模型的输入指标,通过指标内部的非线性逻辑来反应一家平台的风险程度。一个恶性非法的网络借贷平台必然会尽可能的扩大自身的影响力、同时做好反调查准备,在监管单位有所反应之前圈到足够的钱,这种行为很难不在网络上留下痕迹。因此,社会公开信息指标的引入可以有效弥补官方观数据的不足及真实性问题,增强预警模型的可信度和有效性。
综上所述,网贷平台风险评估体系如表1所示,各指标的原始数据如表2所示。
4BP神经网络的设计
4.1BP神经网络概述
BP神经网络中BP是back propagation的缩写,译为反向传播,因此BP神经网络又称误差反向传播神经网路,是1986年由Rumelhart和McClelland为首的科学家提出的概念。BP神经网络通过采用误差逆向传播算法,由程序自动学习演算使得误差降至最小值,以得到最接近真实情况的权值。
BP神经网络属于多层感知机,是由多个感知机层全连接组成的前馈神经网络,全连接是指层上任一神经元与邻近层上的任意神经元之间都存在连接,该模型拥有出色的处理非线性问题的能力。 BP神经网络具有输入层,隐含层和输出层,理论上已经证明一个隐含层的BP神经网络可以实现任意非线性映射,可以满足绝大部分场合的需要。
4.2BP模型神经节点设置
本文采用的是标准结构的BP神经网络,包括一个输入层、一个隐含层和一个输出层。其中,输入层的节点数为13,由输入指标的数量决定;输出层的节点数为1,其中健康平台的平台值为0,问题平台值为1。
隐含层的节点数选择和输入层神经单元以及输出层神经单元数量有关。但目前还没有很好地确定依据,根据任务来确定隐含层节点的数量是比较困难的。因此,目前还是主要以过往的成功经验为依据,一般参考的经验公式是:L=log2n,n为输入节点数,因此隐含层的节点数为3。
4.3BP模型参数设置
再确认了BP神经网络模型的输出层,隐含层和输出层节点后,还要确定神经网络的传输函数和训练目标等参数。非线性的传递函数主要分为Log-sigmoid和Tan-sigmoid两种。其中Log-sigmoid型输入值可取任意值,输出值范围为(0,1),Tan-sigmoid型输入值可以取任意值,输出值范围为(-1,1);线性传递函数pureline的输出和输出可以取任意值。因为本文输出值都为正数,因此输入层传播函数为Log-sigmoid函数,输出层传播函数选择pureline函数,可接受的误差标准为ε= 0.1,训练次数为100000,学习速率为0.2,动量因子为0.1。
5面相Python的BP神经网络的训练和检验
本文综合参考网贷之家等多个网贷平台评级网站,综合考虑选择11家优质网络平台作为低风险样本,同时选择6家最近刚刚暴雷的平台作为高风险样本。并从中随机抽取两家低风险两家高风险作为检验样本,其余13家为训练样本。网络的训练和检验都通过Python来完成。通过整理可以得到一个17×13的矩阵,为取消各指标之间的数量级差别,从而最大程度降低预测误差,将原始数据归一化处理。归一化处理后训练模型的输入值如表3所示,检测模型的输入值如表4所示。
对于已经训练完成的BP网络模型,训练输入值对建立的BP网络进行检测,输出结果如表5所示。
根据检测结果,检验输出和期望输出值非常接近,准确率达到了100%,两者数据误差满足误差要求。因此,建立的BP神经网络模型有较好的风险评估能力,可用来对网贷行业进行监测,达到风险预警的目的。
6研究结果
构建一个科学有效的网贷平台风险预警模型,可以快速对网贷平台进行初步排查,尽早识别和预警高风险网贷平台,已采取风险防范和化解措施。传统的数理模型大多通过数理统计、逻辑回归等方进行预测,这并不适用于网贷平台这一新型金融模式的风险预警上。另外传统模型也过度于依赖于历史官方统计数据,但是网贷平台相关法规的不完善,平台自身可以通过调整统计端口等方法肆意修改数据,从而造成预警模型的失灵。本文大量采用网络公开数据,这是网贷平台无力修改的,虽然不能直观的反应平台风险状况,但是数据本身的真实性反而能够保证预警模型的科学有效。另外,由于公开数据的获得无门槛,从而大大降低了模型使用难度。神经网络的优点就是反应数据之间非直观的复杂联系,因此本文大胆使用公开数据,该模型甚至可以成为普通民众对网贷平台的风险监测工具,若能得到大范围使用,必将倒逼网贷平台主动走向规范化正规化,让网贷平台主动走到监管的笼子里,从而让杜绝大面积平台暴雷,实控人跑路,投资人上访的不良事件。
参考文献
[1]谢平,邹传伟.互联网金融模式研究[J].金融研究,2012,(12).
[2]王峥.我国互联网金融的风险分析及防范措施[J].时代金融,2014,(8).
[3]曹一.论加强P2P网络借贷平台的监管[J].金融监管,2011,(4).
[4]陈朝晖,张艳芳.基于BP神经网络的商业银行风险预警模型研究[J].福建商业高等专科学报,2011,(2).
[5]Tam KY. Neural Network Models and the Prediction of Bank Bankruptcy [J]. Omega,1991,(5).
[6]杨群华.我国互联网金融的特殊风险及防范研究 [J].金融科技时代,2013,(7) .
[7]郭瑩莹.国内外金融危机预警模型述评[J].科学决策,2013,(10).
[8]张玉梅.P2P 小额网络贷款模式研究[J]. 生产力研究,2010,(12).