基于集成学习融合模型的信用评分模型改进与应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:kkkk8043
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信用评分问题是信贷领域的核心问题之一。近年来随着信贷业务的蓬勃发展,信贷客户数量高速增长,客户组成也日趋复杂,这给金融部门的风险控制能力提出了更高的要求,也促进了信用评分领域的进一步研究。本文基于机器学习方法,针对信用评分问题提出了改进的GBDT-LR融合模型。改进的GBDT-LR融合模型利用改进的梯度提升树模型进行特征变换,并使用改进了逻辑回归模型处理变换后的特征,最终输出客户的信用评分。对于梯度提升树的改进,本文提出了一种新的自适应缩减因子,能够有效保证梯度提升树模型中基模型的稳定性;同时,不同于常见的直接使用梯度提升树模型的输出值,本文保留了梯度提升树模型中基模型的结构,将每个基模型的输出进行编码,最终达到特征变换的效果。对于改进的逻辑回归模型,本文引入自适应Lasso方法对逻辑回归模型的参数空间进行约束,可以采根据具体样本集自适应地调整Lasso方法的参数,进而达到减少过拟合,降低维度和提高模型稳定性的作用。本文使用随机生成数据集和真实信贷数据集对改进的GBDT-LR融合模型进行了验证,并与传统的逻辑回归模型、未经改进的GBDT-LR模型、人工神经网络模型进行对比。随机生成数据集上的结果表明,改进的GBDT-LR融合模型在线性可分数据集的效果略优于其它模型,在非线性可分模型上的表现明显优于其它模型。真实信贷数据集上改进的GBDT-LR融合模型的AUC值为0.7501,KS值为0.3768,同样优于其它模型。这说明改进的GBDT-LR融合模型在信用评分问题中有着更好的效果。
其他文献
自2007年P2P网络借贷进入中国以来,已经经过了十三余年。现如今P2P网络借贷平台数量已高达六千余个,累计成交金额达亿万元,出借人和借款人达一亿余人次,已然成为了一个颇具规模的新兴互联网行业。虽然P2P网络借贷的规模和社会影响力日益增加,承担的社会职能也日益增大,但是国家监管一直处于缺位状态,相关法律法规未能及时进行补充,导致P2P网络借贷的野蛮生长。2016年以来P2P网络借贷频出乱象,所涉及
红火蚁(Solenopsis invicta Buren)是一种入侵性强危害性大的有害生物。2004年首次发现在我国大陆发生危害并对我国的农林作物生产、人体健康、公共设施安全、和生态环境安全
我国雾霾天气频发,PM2.5已经成为影响大气环境质量的首要污染物,随着室外大气污染的加重室内空气质量也无法得到保证,许多空调系统中配置空气过滤装置来过滤送风气流,从而降
天津近岸海域,地处渤海湾最西端,历史上该海域渔业资源十分丰富,是许多洄游性鱼类的产卵场、育幼场和索饵场。然而,受围填海工程等人类活动的影响,天津近岸海域渔业资源结构
随着DNA合成和测序的快速发展,菌株改造开始成为代谢工程和合成生物学中的限速步骤。我们开发了一种称为gRNA-tRNA-array Clustered Regularly Interspaced Short Palindromic Repeats-Cas9(GTR-CRISPR)的系统,用tRNA序列将多个gRNA串联起来表达,极大提高了在酿酒酵母中的基因编辑数目和效率。利用此系统,在获得引物后7
指出近来随着股份制公司的深入发展和证券市场功能的不断完善,我国上市公司的发展取得了显著成就,并揭示出我国上市公司存在的各种问题.认为加大上市公司监管力度、提高上市