基于决策树的特征分箱算法在商业银行信用评分模型中的应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:csy355
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技在金融领域的深入运用以及我国普惠金融政策的不断推出,消费信贷领域在近几年里迎来了爆发式的增长。新兴的互联网金融公司在信用贷款领域攻城拨寨,大大拓展了金融信贷产品用户的广度和深度。同时在信贷客户背景日益复杂的背景下,对金融机构的风险把控与识别能力提出了更高的要求。互联网金融公司开始广泛应用以机器学习为代表的金融科技技术来辅助风控,商业银行也开启了一波金融科技转型浪潮,逐渐将更多的新技术、新工具应用到传统消费信贷领域中。本文通过对商业银行标准信用评分模型的开发流程进行剖析的基础上,针对其中影响模型效果最为关键的环节-特征分箱进行了方法探索,将机器学习中的决策树算法引入特征分箱过程中,以基尼系数为分箱依据,并辅以最大树深度和最小叶节点数等参数,实现基于决策树的特征分箱方法。通过这种方式,减少特征分箱中数据信息的损失,并提高模型预测效果。数据对比显示,基于决策树的分箱算法与传统的等频分箱法相比,变量IV值得到了较大幅度的提升。本文以一份互联网金融领域中的真实信贷还款数据为研究对象,采用标准信用评分建模方法,将决策树纳入特征分箱算法中。在经历数据清洗和衍生、关键定义确定、样本选取、训练集测试集划分、特征分箱、WOE及IV值计算、相关系数及多重共线性检验、模型建立、分数校准等步骤建立信用评分模型,并对模型效果进行评估。结果发现,基于决策树的特征分箱算法能充分挖掘入模数据的隐含信息,在小样本情况下依然能够得到相当不错的预测效果。为商业银行信用评分模型的开发提供了一种新颖且有效的思路,具有较好的实际应用意义。
其他文献
学位
学位
学位
学位
氧化物冶金技术的发展,为大线能量焊接用钢的研发开辟了新路径,国内外也取得了一致的看法:氧化物夹杂可以为针状铁素体形核提供核心,并有效抑制焊接热影响区晶粒的长大,但如何得到尺寸、形态、分布有效的氧化物夹杂是生产的难点。选用FH40船板钢为基准钢,冶炼含铈、锆和铈锆复合的实验钢,研究实验船板钢中不同氧化夹杂物对铸态组织、轧态组织和焊接热影响区组织的影响。研究结果对氧化物冶金理论的充实与完善和对铝脱氧钢
学位
学位
学位
新冠肺炎疫情是人类正在面临的最重大的公共卫生危机,时至2021年3月在全球已造成两百多万条生命的丧失,也给国际关系、世界经济和全球格局等带来巨大冲击。公共卫生产品是解决公共卫生问题,维护公共卫生安全的重要工具,公共卫生治理成效的取得离不开公共卫生产品的充分供应。新冠疫情对于中国来说既是挑战也是机遇,虽然给中国造成了重大损失,但无形中也为中国带来了建设“一带一路”卫生健康共同体进而在全球公共卫生治理
城市是一个永远处于运动状态的复杂系统。城市内部的物质要素之间都不是独立存在的,城市中各地块、各区域之间通过人员、物质、信息等的流动而产生相互联系和作用,即空间交互作用,从而构成一个完整的城市系统。一方面,城市的自然地理条件与历史发展背景会影响空间交互的形成和特征变迁;另一方面,区域之间空间交互的消长又会反过来影响城市社会经济的空间布局以及扩展方向。深入理解城市内部的空间交互特征、及其表现出来的城市