基于集成学习的信用风险预测研究

来源 :兰州大学 | 被引量 : 3次 | 上传用户:jiugeqingjiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
消费信贷是金融机构为满足消费者对商品、服务的消费需求所提供的贷款服务并要求用户按期偿还的一种信贷活动。随着互联网金融的快速发展,信用风险也是众多金融机构面临的主要问题。信用风险是指银行向用户提供金融服务后用户不履行到期债务的风险,信用风险一直是银行贷款决策中主要研究的领域。本文主要研究集成学习算法在信用风险预测中的应用。文章介绍了简单机器学习算法:KNN、朴素贝叶斯、Logistic回归、决策树;集成学习算法:GBDT、XGboost、随机森林这三种以决策树作为基学习器和以随机森林作为基学习器的GBM,以及常用的评价模型性能的指标。在实证分析中,本文先对特征进行了哑元化处理;然后采用简单的机器学习算法对数据进行拟合,使用查准率、查全率和AUC等模型评估指标选出最优的模型瘖瘖决策树;最后将决策树作为基学习器进行进一步的集成学习。我们发现GBM的拟合效果最好,随机森林的效果次之,从而为金融机构贷款业务的授信审批提供了参考依据。目前国内关于梯度提升机(GBM)的应用主要集中在交通和行人检测、电子商务、异常检测等方面,在其他领域的应用比较少,尤其是以随机森林为基学习器的梯度提升机的应用就更少了。本文的创新之处是将GBM引入到信用风险的预测当中,使用了以随机森林为基学习器的GBM,并将查准率和查全率作为模型评估的指标。
其他文献
风险管理理论已广泛应用于项目的设计、采购及施工等各个阶段。在建设项目施工阶段的应用,特别是在施工事故的主动预防领域的应用,国外企业已取得不少成效。通常建设项目的施
肥胖症是当今医学亟待解决的课题,但目前对肥胖症病因病机的探讨、治疗方法上与五年前相比并无大的突破。作者根据多年针灸治疗肥胖症的经验,结合《黄帝内经》及现代医学对肥
亚微米及纳米颗粒两相流是自然界的普遍现象,并且在大气环境科学、现代纳米材料制备、工程热物理、化工合成、吸入毒理学及医疗制药等诸多领域得到广泛应用,是目前流体力学的
会议
目的比较血液透析滤过(HDF)与常规血液透析(HD)对尿毒症患者β2-微球蛋白(β2-MG)清除的影响。方法查阅中国期刊全文数据库收录的自1992至2008年间发表的有关应用HDF与常规HD
目的:总结颈椎椎管狭窄症的临床诊疗概况,为颈椎椎管狭窄症的临床诊疗提供理论依据。方法:通过检索近10年国内外关于颈椎椎管狭窄症的临床诊疗报道情况,归纳出一整套针对颈椎
<正>眼白发蓝,这种征象多是慢性缺铁造成。铁是巩膜表层胶原组织中一种十分重要的物质,缺铁后可使巩膜变薄。巩膜掩盖不了巩膜下黑蓝色的脉络膜时,眼白就呈现出蓝色来了。而
学习是学生主动的构建活动,学习应与一定的问题情境相联系,在良好的问题情境中学习,可以使学生利用原有的知识和经验同化当前要学的新知识,这样获取的知识,不但便于保持,而且
目的:分析总结骨外骨肉瘤的影像学表现。方法:回顾性分析8例确诊为骨外骨肉瘤患者的病历、病理切片和放射学表现。结果:发生于软组织部位的4例(右腹壁肌群1例,右侧腹直肌1例,
乡村转型之所以说十分紧迫,就是因为当前的乡村产业发展带来了多种多样的社会问题,如果问题恶化,中国农业体系就会不稳定,从而导致城镇出现危机。保护好、改善好、建设好广大