基于集成学习的信用评分模型应用研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:ssxjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济体制改革的深入发展和市场经济体系的不断完善,个人信贷业务快速发展。但是在个人信贷业务不断发展的同时,也面临风险控制的问题。信用评分模型是在银行信贷中提供正确指导决策的有效工具。良好的信用评分模型不仅可以减少放贷机构的风险,并且能够节省时间提高效率。在过去几十年中,信用评分已成为金融机构日益关注的问题,目前仍是一个热门的研究课题。信用评分是一种二分类技术。当前构建信用评分模型有三种主流分类方法,一是传统的统计学方法,如逻辑回归、线性判别分析等;第二种采用机器学习方法,如朴素贝叶斯、决策树等;第三种就是集成学习方法,包括随机森林、GBDT(Gradient Boosting Decision Tree)等。近期的许多研究已经证明,集成学习模型相比较于传统分类算法在信用评分领域有明显的优势。但是,大多数的研究只追求模型的性能表现,忽视了现实信用评分业务中的数据不平衡问题和模型可解释性。为了解决上述现实信用评分业务中的两大问题,本文提出了基于集成学习的信用评分模型EL-CSM(Ensemble Learning Credit Scoring Model),使其可以适应不平衡数据的挖掘并具有良好的模型可解释性。对于数据不平衡问题,针对性的构建了模型的评价指标,提出了基于集成学习改进的不平衡数据下采样方法。并且在模型的构建过程中,充分考虑到了模型的可解释性,在建模前、建模中进行了一系列的优化,并提出了基于集成学习的特征选择算法。使用贝叶斯模型进行了超参数优化。并且在三个信用评分数据集上设计了完整的实验过程进行了模型性能和可解释性的验证。通过数据预处理、超参数优化、四组对照实验以及模型解释,证明了本文提出的模型拥有良好的性能,同时具有良好的可解释性,在模型的实用性上有明显的优势。
其他文献
1998年~2005年,我过GDP连续八年年增长速度在8%以上。然而,在高增长的背后,却是日益严重的失业率问题,以及普通居民收入增加缓慢问题。随着GDP的持续增长,这些问题越来越突出,贫富差
伴随着互联网技术的革新以及网络媒体直播平台的大发展,网络直播'井喷式'的增长给互联网经济注入了新鲜的血液。但是由于内容同质化、主播和受众素质良莠不齐、监管
针对小功率电源的设计,详细介绍了单端反激变压器中连续电流模式(ContinuousCurrentMode,CCM)和断续电流模式(DiscontinuousCurrentMode,DCM)下变压器的工作原理,论述了采用
随着我国市场经济体制的逐步确立和金融市场的充分发展,会计信息不仅成为广大投资者决策的依据,而且成为国家财政、税收管理部门实行宏观经济调控和微观协调的依据。但是,目前我
本文从分析客户忠诚测度手段入手,概括了客户忠诚的三个重要特征,通过实证的研究方法研究了长期购买、推荐、预期再购买对客户忠诚测量的有效性和精确性。并对三个维度的关系做
[摘要] 随着科学、理性消费观念及健康观的日渐普及,消费者强烈呼吁食品类应当明明白白消费。理性选择的前提是知情,消费者只有在对欲消费的食品的真实情况有所了解,才能做出比较理性和适合自己的消费选择。因此,知情权是消费者参与消费活动应当享有的权利。消费者食品安全知情权的落实需要社会各方面的配合与努力。  [关键词] 消费者食品安全知情权经营者告知义务
名称具有丰富的传播功能。好的品牌名称,往往是最简短、最直接、最生动的广告语。本文用传播学原理,从文字媒介传播特性、具体传播技巧、音韵学原理等多方面解读宝洁在华品牌名
随着我国入世后金融业于今年年底的全面开放,越来越广泛的金融衍生工具的应用对我国的会计产生了极大的影响。金融衍生工具由于自身所具有的各种优点及其所伴随的巨大风险对会
上海梅山磁性材料厂隶属于宝钢集团南京梅山冶金发展有限公司资源分公司。公司地处南京中华门外新建,南邻205国道,北依长江,距南京长江三桥仅五公里,水陆交通十分便利。我厂于200
从吸气周边环境、工艺流程、设备以及安全管理等几个方面对煤化工企业空分装置安全生产管理进行了探讨。