论文部分内容阅读
摘要:P2P网贷问题逐渐暴露在公众视野中,没有统一的方法来有效地评估借款人的信用风险是导致问题出现的原因之一。文章提出一种基于思维进化算法优化SKohonen神经网络的P2P网贷借款人信用风险评估模型并进行实验仿真,实验结果表明该模型的分类准确率较高,在数据集样本量丰富时的评估预测能力较好,应用于评估预测P2P网贷借款人信用风险评估会有较好的效果。
关键词:P2P网贷;SKohonen神经网络;思维进化算法;借款人信用评级
一、P2P网贷概述
“网贷之家”网站所提供的相关数据显示,截至2019年12月,网贷平台正常运营平台数量343家,相比2018年年底减少了732家,累计停业转型平台数量3343家,累计问题平台数量2924家。据2019年中国借贷行业年报上的数据显示,2019年全年网贷行业成交量达到了9649.11亿元,相比2018年全年网贷成交量(17948.01亿元)减少了46.24%,从数据可以发现2019年全年成交量创了近5年的新低。截至2019年年底,网贷行业总体贷款余额下降至4915.91亿元,同比2018年下降了37.69%。在银保监会的监督管理下, P2P网贷平台进入了平稳发展的阶段,但是从数据中可以看到,平台依然存在网站关闭,延期兑付,提现困难和经侦介入等问题,大部分网贷平台的抗风险能力和自我修复能力着实令人担忧。
信用风险是金融服务中风险管控的重要指标,在互联网金融中,获得借款人有效的身份信息并依此正确分类其信用等级,能够有效防范风险的发生,同样是推动征信管理健康稳健可持续发展的重要环节。通过参考国内外互联网金融和网贷平台风险评价的文献和信用评价的方法,发现现有的许多文献对借款人信用风险的预测评估研究较少,并且分析方法以传统的量化分析模型居多,难以满足当前大数据时代下对网贷借款人信用风险的准确评估。
二、思维进化算法优化的SKohonen神经网络模型及数据预处理
(一) Kohonen神经网络
Kohonen神经网络是从竞争神经网络发展来的,网络为两层结构,分别为输入层和竞争层,竞争层神经元多以二维或多维的结构排列,采用无监督学习的方式训练。
在竞争层中,每次样本的输入只会产生一个获胜神经元。设输入层有m个神经元,核心层有n个神经元,则权值就应该是m×n的矩阵。若输入向量为P=[p1,p2,…,pm],则网络的输出为Y=Pω。竞争层的n个神经元通过响应必然会有一个神经元成为获胜神经元Yk,该获胜神经员的权值修正方法为Δωik=η(Pi-ωik)Yk,由此可以看出,权值以速率η向样本Pi靠近,由于获胜神经元Yk的权值趋近于输入样本Pi,因此在下一次迭代中Yk有更大的概率胜出,当速率η的步长适当时,获胜神经元对应的输入样本的网络权值会不断靠近输入样本并且差距越来越小。
对Kohonen网络进行改进使其具有聚类的功能,在竞争层后再额外增加一个输出层,变成一个有监督学习的网络,即SKohonen网络。增加的输出层的神经元个数与数据集的应有类别数量相同。输出层神经元和竞争层神经元连接权值为ωjk,SKohonen网络在权值调整时,同时调整输入层与竞争层、竞争层与输出层的两类权值,ωjk的权值调整方式为ωjk(n+1)=ωjk(n)+η2(Yk-ωjk( n)),其中,ωjk为核心层和输出层之间的权值,η2为学习率,Yk为样本的实际所属类别。
(二)思维进化算法
著名学者孙承意改进传统进化算法的缺陷,提出了思维进化算法,这种算法的全局收敛性能较好,且网络优化速度和收敛速度有较大提升。思维进化算法的迭代过程是:在一个D维的解空间中,对若干个不同个体X赋予不同的初始得分,对所有得分进行排序,具有较高得分的N个个体作为初始中心Ci,然后在每个初始中心周围集合若干个个体形成N个子种群,然后执行趋同操作,即以每个子种群的中心开始搜索局部区域的更优值替换原来的中心个体,直到发现最优值后形成一个迭代成熟的子种群,然后子种群执行异化操作,在解空间中不断地移动去更新优胜子种群,完成种群之间的替换、废弃和重组过程,最后重新计算每个优胜子种群的得分,最后比较得分,得到全局最优解,也就是胜者,算法迭代结束。
(三)数据预处理并建立思维进化算法优化的SKohonen神经网络模型
神经网络无法识别文本内容,因此在训练仿真前对选取的8个指标进行数值转换,8个指标分别为年龄、婚姻状况、文化程度、房产情况、工作时间、单位性质、收入情况和历史信用,将每个指标的文本信息量化成[0,1]之间的具体数值,以方便进行下一步的神经网络计算,根据违约风险的可能性的大小对每种指标进行量化,违约风险小的量化的数值高,违约风险大的量化的数值低。
本文选取使用较多的人人贷借款人数据集作为分析样本,信用评级中AA等级为最高,HR等级为最低,信用等级越高,借款人违约的可能性越小。本文共选取选取130组借款人信息作为信用风险评估的样本,其中无违约借款人信息有100条,违约借款人信息有30条,样本数量及分布如表1所示。
然后随机选取100组数据(80条无违约和20条违约)作为训练数据,30组数据(20条无违约和10条违约)作为测试数据。由表1可以看出,所选取的数据集中缺失信用评级为AA和B的样本,可能会导致神经网络模型无法学习到这两种样本的特征,因此本文所建立的神经网络模型智能评估5种类型的借款人信用评级,其中信用评级为E和HR的样本在无违约借款人和违约借款人中均存在,其中E类型共有8个样本,占比6.16%,HR类型共有33个样本,占比25.38%。
在建立的SKohonen网络中,以选取的8个指标为输入,即输入向量共有8维,故设置输入层神經元个数为8,设置距离函数为dist函数,即求欧式距离,网络的拓扑结构为8×8,即竞争层共有64个神经元,网络学习次数为10000次,最大邻域为1.5,最小邻域为0.3,最大学习率为0.1,最小学习率为0.01。本文选取的数据集中信用评级共有五个层级:A、C、D、E、HR,共有5种不同的输出,因此数据集共有5中type类型,所以额外增加的输出层神经元个数为5。在思维进化算法中,经过多次实验测试,设置种群大小为200,优胜子种群个数为5,临时子种群个数为5,即一个子种群中个体的个数为20,网络迭代次数为200。 三、仿真结果
本文仿真实验基于MATLAB R2014b平台,实验仿真结果如表2所示。
由表1和表2可知,数据集中样本A和HR的数据量充足,占比较大,所以MEA-SKohonen神经网络模型对这两种类型的样本学习充分,几乎能够掌握这两种样的特征并正确归类,所以经过测试集的仿真,样本A的分类准确率为94.12%,样本HR在无违约借款人和违约借款人中的分类准确率较高,分别为50%和100%,样本HR的分类准确率合并共计90.90%。样本C、D和E的数据量过小,导致思维进化算法优化的SKohonen神经网络模型对这两种信用评级的样本的特征学习不足,在测试集中样本D和E均分类错误,说明神经网络模型需要充足的数据量才可以较好地学习到样本的特征,当数据集中样本分布不均衡时,极有可能导致神经网络对数据量少的样本学习不充分,导致欠拟合现象,因此仿真结果中对样本D和E的分类准率不高。
本文所建立的基于思维进化算法优化SKohonen神经网络的P2P网贷借款人信用风险评估模型,整体分类准确率较高,尤其对于信用评级为A和HR的样本,分类准确率均高于90%,其余样本分类准确率低是由于数据集样本分布不均衡导致,在日后充分收集数据量较少的样本并扩充到整个数据集中,使七种不同信用评级的数据量充分且均衡,就可以明显弥补现有数据集的缺陷,使神经网络模型充分学习到每种样本的特性。
四、结论及相关建议
(一)实验结论
总体看来,基于思维进化算法优化SKohonen神经网络的P2P网贷借款人信用风险评估模型的评估预测能力较强,当数据量充足时可以很好地评估P2P网贷借款人信用评级,对于网贷平台更为主动地评估控借款人的信用风险状况有一定的指导作用,对信用评级较低的借款人予以借款限制,可以有效降低因借款人个人原因违约欠款的可能性,保护平台和投资人利益不受损失。
(二)相关建议
目前我国经济发展状况稳中有进,互联网金融的相关政策法规在不断完善,P2P网络借贷的发展也在逐步规范,根据现在的发展状况和存在的风险,本文最后提出促进P2P网贷平台健康发展的相关建议:
1. 完善行业征信体系
目前网贷平台的借款人信用评级信息还没有得到中国人民银行征信系统的支持,所以在借款人信用风险评估方面还存在有很多的不确定性,应该在金融大数据的支持下,逐步建立共享机制、成熟的征信体系和规范的服务机制,快速准确审核网贷业务并评估借款人信用风险,建立完善的借贷信用评级体系,使网贷平台健康发展。
2. 完善信息共享制度
P2P网贷平台不能只公布平台自身的信息,还应在法律允许的范围内及时向投资人公布借款人的风险评估状况,融资项目及款项使用进度等信息,同时网贷平台之间还应该加强信息数据交流,建立一个统一的黑名单平台,逐步建立网贷平台内部的信息共享制度。
3. 完善相关制度规范
政府应当加强巡查,监督平台运行的合法性,彻底杜绝庞氏骗局、平台自融和巧设资金池等欺骗投资者的行为,对平台的信用风险进行评估并公示,不断完善法律并规范平台运营,整合各方监管的合力,树立网贷平台的良好公众形象,为投资人和借款人提供有益参考。
4. 加强借款人信息审核
开发优质的借款人信用风险评估应用APP,采用大数据的方式深度挖掘借款人的相关信息,尽可能从多维度进行信用评级,降低因恶意违约造成的坏账率,同时采取线上和线下相结合的审核机制,实地走访了解借款人信息,尽可能减少借款人提供的虚假信息对信用评级产生的消极影响。
参考文献:
[1]李昕,戴一成.基于BP神经网络的P2P网贷借款人信用风险评估研究[J].武汉金融,2018(02):33-37.
[2]Kohonen T. Self-organization and associative memory:3rd edition[J].2006,8(01):3406-3409.
[3]Sun C, Sun Y, Xie K. Mind-evolution-based machine learning: an efficient approach of evolution computation[C]// World Congress on Intelligent Control & Automation,2000.
[4]肖會敏,侯宇,崔春生.基于BP神经网络的P2P网贷借款人信用评估[J].运筹与管理,2018,27(09):116-122.
(作者单位:张泽、樊江伟,中国人民银行兰州中心支行;周南,中国人民银行东乡县支行,兰州大学管理学院。张泽为通讯作者)
关键词:P2P网贷;SKohonen神经网络;思维进化算法;借款人信用评级
一、P2P网贷概述
“网贷之家”网站所提供的相关数据显示,截至2019年12月,网贷平台正常运营平台数量343家,相比2018年年底减少了732家,累计停业转型平台数量3343家,累计问题平台数量2924家。据2019年中国借贷行业年报上的数据显示,2019年全年网贷行业成交量达到了9649.11亿元,相比2018年全年网贷成交量(17948.01亿元)减少了46.24%,从数据可以发现2019年全年成交量创了近5年的新低。截至2019年年底,网贷行业总体贷款余额下降至4915.91亿元,同比2018年下降了37.69%。在银保监会的监督管理下, P2P网贷平台进入了平稳发展的阶段,但是从数据中可以看到,平台依然存在网站关闭,延期兑付,提现困难和经侦介入等问题,大部分网贷平台的抗风险能力和自我修复能力着实令人担忧。
信用风险是金融服务中风险管控的重要指标,在互联网金融中,获得借款人有效的身份信息并依此正确分类其信用等级,能够有效防范风险的发生,同样是推动征信管理健康稳健可持续发展的重要环节。通过参考国内外互联网金融和网贷平台风险评价的文献和信用评价的方法,发现现有的许多文献对借款人信用风险的预测评估研究较少,并且分析方法以传统的量化分析模型居多,难以满足当前大数据时代下对网贷借款人信用风险的准确评估。
二、思维进化算法优化的SKohonen神经网络模型及数据预处理
(一) Kohonen神经网络
Kohonen神经网络是从竞争神经网络发展来的,网络为两层结构,分别为输入层和竞争层,竞争层神经元多以二维或多维的结构排列,采用无监督学习的方式训练。
在竞争层中,每次样本的输入只会产生一个获胜神经元。设输入层有m个神经元,核心层有n个神经元,则权值就应该是m×n的矩阵。若输入向量为P=[p1,p2,…,pm],则网络的输出为Y=Pω。竞争层的n个神经元通过响应必然会有一个神经元成为获胜神经元Yk,该获胜神经员的权值修正方法为Δωik=η(Pi-ωik)Yk,由此可以看出,权值以速率η向样本Pi靠近,由于获胜神经元Yk的权值趋近于输入样本Pi,因此在下一次迭代中Yk有更大的概率胜出,当速率η的步长适当时,获胜神经元对应的输入样本的网络权值会不断靠近输入样本并且差距越来越小。
对Kohonen网络进行改进使其具有聚类的功能,在竞争层后再额外增加一个输出层,变成一个有监督学习的网络,即SKohonen网络。增加的输出层的神经元个数与数据集的应有类别数量相同。输出层神经元和竞争层神经元连接权值为ωjk,SKohonen网络在权值调整时,同时调整输入层与竞争层、竞争层与输出层的两类权值,ωjk的权值调整方式为ωjk(n+1)=ωjk(n)+η2(Yk-ωjk( n)),其中,ωjk为核心层和输出层之间的权值,η2为学习率,Yk为样本的实际所属类别。
(二)思维进化算法
著名学者孙承意改进传统进化算法的缺陷,提出了思维进化算法,这种算法的全局收敛性能较好,且网络优化速度和收敛速度有较大提升。思维进化算法的迭代过程是:在一个D维的解空间中,对若干个不同个体X赋予不同的初始得分,对所有得分进行排序,具有较高得分的N个个体作为初始中心Ci,然后在每个初始中心周围集合若干个个体形成N个子种群,然后执行趋同操作,即以每个子种群的中心开始搜索局部区域的更优值替换原来的中心个体,直到发现最优值后形成一个迭代成熟的子种群,然后子种群执行异化操作,在解空间中不断地移动去更新优胜子种群,完成种群之间的替换、废弃和重组过程,最后重新计算每个优胜子种群的得分,最后比较得分,得到全局最优解,也就是胜者,算法迭代结束。
(三)数据预处理并建立思维进化算法优化的SKohonen神经网络模型
神经网络无法识别文本内容,因此在训练仿真前对选取的8个指标进行数值转换,8个指标分别为年龄、婚姻状况、文化程度、房产情况、工作时间、单位性质、收入情况和历史信用,将每个指标的文本信息量化成[0,1]之间的具体数值,以方便进行下一步的神经网络计算,根据违约风险的可能性的大小对每种指标进行量化,违约风险小的量化的数值高,违约风险大的量化的数值低。
本文选取使用较多的人人贷借款人数据集作为分析样本,信用评级中AA等级为最高,HR等级为最低,信用等级越高,借款人违约的可能性越小。本文共选取选取130组借款人信息作为信用风险评估的样本,其中无违约借款人信息有100条,违约借款人信息有30条,样本数量及分布如表1所示。
然后随机选取100组数据(80条无违约和20条违约)作为训练数据,30组数据(20条无违约和10条违约)作为测试数据。由表1可以看出,所选取的数据集中缺失信用评级为AA和B的样本,可能会导致神经网络模型无法学习到这两种样本的特征,因此本文所建立的神经网络模型智能评估5种类型的借款人信用评级,其中信用评级为E和HR的样本在无违约借款人和违约借款人中均存在,其中E类型共有8个样本,占比6.16%,HR类型共有33个样本,占比25.38%。
在建立的SKohonen网络中,以选取的8个指标为输入,即输入向量共有8维,故设置输入层神經元个数为8,设置距离函数为dist函数,即求欧式距离,网络的拓扑结构为8×8,即竞争层共有64个神经元,网络学习次数为10000次,最大邻域为1.5,最小邻域为0.3,最大学习率为0.1,最小学习率为0.01。本文选取的数据集中信用评级共有五个层级:A、C、D、E、HR,共有5种不同的输出,因此数据集共有5中type类型,所以额外增加的输出层神经元个数为5。在思维进化算法中,经过多次实验测试,设置种群大小为200,优胜子种群个数为5,临时子种群个数为5,即一个子种群中个体的个数为20,网络迭代次数为200。 三、仿真结果
本文仿真实验基于MATLAB R2014b平台,实验仿真结果如表2所示。
由表1和表2可知,数据集中样本A和HR的数据量充足,占比较大,所以MEA-SKohonen神经网络模型对这两种类型的样本学习充分,几乎能够掌握这两种样的特征并正确归类,所以经过测试集的仿真,样本A的分类准确率为94.12%,样本HR在无违约借款人和违约借款人中的分类准确率较高,分别为50%和100%,样本HR的分类准确率合并共计90.90%。样本C、D和E的数据量过小,导致思维进化算法优化的SKohonen神经网络模型对这两种信用评级的样本的特征学习不足,在测试集中样本D和E均分类错误,说明神经网络模型需要充足的数据量才可以较好地学习到样本的特征,当数据集中样本分布不均衡时,极有可能导致神经网络对数据量少的样本学习不充分,导致欠拟合现象,因此仿真结果中对样本D和E的分类准率不高。
本文所建立的基于思维进化算法优化SKohonen神经网络的P2P网贷借款人信用风险评估模型,整体分类准确率较高,尤其对于信用评级为A和HR的样本,分类准确率均高于90%,其余样本分类准确率低是由于数据集样本分布不均衡导致,在日后充分收集数据量较少的样本并扩充到整个数据集中,使七种不同信用评级的数据量充分且均衡,就可以明显弥补现有数据集的缺陷,使神经网络模型充分学习到每种样本的特性。
四、结论及相关建议
(一)实验结论
总体看来,基于思维进化算法优化SKohonen神经网络的P2P网贷借款人信用风险评估模型的评估预测能力较强,当数据量充足时可以很好地评估P2P网贷借款人信用评级,对于网贷平台更为主动地评估控借款人的信用风险状况有一定的指导作用,对信用评级较低的借款人予以借款限制,可以有效降低因借款人个人原因违约欠款的可能性,保护平台和投资人利益不受损失。
(二)相关建议
目前我国经济发展状况稳中有进,互联网金融的相关政策法规在不断完善,P2P网络借贷的发展也在逐步规范,根据现在的发展状况和存在的风险,本文最后提出促进P2P网贷平台健康发展的相关建议:
1. 完善行业征信体系
目前网贷平台的借款人信用评级信息还没有得到中国人民银行征信系统的支持,所以在借款人信用风险评估方面还存在有很多的不确定性,应该在金融大数据的支持下,逐步建立共享机制、成熟的征信体系和规范的服务机制,快速准确审核网贷业务并评估借款人信用风险,建立完善的借贷信用评级体系,使网贷平台健康发展。
2. 完善信息共享制度
P2P网贷平台不能只公布平台自身的信息,还应在法律允许的范围内及时向投资人公布借款人的风险评估状况,融资项目及款项使用进度等信息,同时网贷平台之间还应该加强信息数据交流,建立一个统一的黑名单平台,逐步建立网贷平台内部的信息共享制度。
3. 完善相关制度规范
政府应当加强巡查,监督平台运行的合法性,彻底杜绝庞氏骗局、平台自融和巧设资金池等欺骗投资者的行为,对平台的信用风险进行评估并公示,不断完善法律并规范平台运营,整合各方监管的合力,树立网贷平台的良好公众形象,为投资人和借款人提供有益参考。
4. 加强借款人信息审核
开发优质的借款人信用风险评估应用APP,采用大数据的方式深度挖掘借款人的相关信息,尽可能从多维度进行信用评级,降低因恶意违约造成的坏账率,同时采取线上和线下相结合的审核机制,实地走访了解借款人信息,尽可能减少借款人提供的虚假信息对信用评级产生的消极影响。
参考文献:
[1]李昕,戴一成.基于BP神经网络的P2P网贷借款人信用风险评估研究[J].武汉金融,2018(02):33-37.
[2]Kohonen T. Self-organization and associative memory:3rd edition[J].2006,8(01):3406-3409.
[3]Sun C, Sun Y, Xie K. Mind-evolution-based machine learning: an efficient approach of evolution computation[C]// World Congress on Intelligent Control & Automation,2000.
[4]肖會敏,侯宇,崔春生.基于BP神经网络的P2P网贷借款人信用评估[J].运筹与管理,2018,27(09):116-122.
(作者单位:张泽、樊江伟,中国人民银行兰州中心支行;周南,中国人民银行东乡县支行,兰州大学管理学院。张泽为通讯作者)