基于Stacking模型的网络车贷违约客户识别研究

来源 :重庆工商大学 | 被引量 : 0次 | 上传用户:wuhaishun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网金融的不断发展,各大金融机构也开通了线上贷款的通道,这不仅拓宽了金融交易途径,为居民消费提供便利,还促进了我国经济的发展。2020年,国家发改委发布了《关于稳定和扩大汽车消费若干措施的通知》,鼓励金融机构积极开展汽车消费信贷,各大网络车贷平台积极响应,创新网络车贷业务,适应客户需求。然而随着网络平台车辆贷款业务成交量的增加,客户违约事件也在不断激增,高风险客户的准入给平台带来经济损失的同时,也让平台陷入巨大的发展危机。事实上,若能在放贷前高效、准确地识别出潜在的风险客户,将有助于网络车贷平台的健康稳定发展。基于此,依托先进的数据挖掘方法对网络车贷平台的潜在违约客户进行准确识别,降低平台经营风险,减少损失,提升平台风险管理水平。具体研究内容如下:首先,基于某网络车贷平台提供的真实车贷数据,对违约客户和非违约客户之间的差异和共性特征进行了探索性分析,并通过数据的入模要求,完成数据预处理和特征工程,为模型构建奠定基础。其次,为了处理数据不均衡问题,本文将欠采样技术、过采样技术以及组合采样技术中的六种数据不均衡处理方法分别与逻辑回归、支持向量机、随机森林以及XGBoost模型相结合,通过拟合数据对比分析发现SMOTETomek-LR、SMOTE-SVM、Borderline SMOTE-RF和Borderline SMOTE-XGBoost这四种组合模型的拟合效果较好,而在这四个中Borderline SMOTE-XGBoost模型的拟合效果最佳,SMOTE-SVM模型效果最差。最后,为了进一步提高模型拟合效果,将单一模型中效果最佳的逻辑回归、随机森林和XGBoost三个模型进行Stacking模型融合,分别构建了标准Stacking模型和三种Stacking改进模型:(1)为了挖掘原始训练集与Stacking初级学习器得到的新训练集之间的隐含关系,在次级学习器中加入原始训练集,构造加入原始训练集的Stacking模型;(2)为了更好地突出第一层中每个学习器性能的好坏,以第一层学习器五折交叉验证后的平均AUC值为作为权重,构造加权Stacking模型;(3)为了综合比较改进效果,构造了加入原始训练集和加权的Stacking模型。通过实验数据验证,加权Stacking模型的综合性能是所有模型中最好的,AUC值、F1值、查全率以及KS值均有所提高。其中,AUC值达到了0.7898,比单一最优模型提高了0.0414。可见,通过构建加权Stacking网络车贷违约客户识别模型,有助于降低该平台的不良贷款率和客户违约风险。
其他文献
共振增强现象是指,在共振结构中,若入射波的频率靠近共振频率,共振结构中的局域场振幅会远远大于入射波的振幅。此现象在超低阈值激光器,超敏传感器等领域有重要应用。共振结构中局域场与入射波最大振幅的比值定义为共振增强倍数,是研究共振增强现象的一个重要指标。共振增强倍数与共振模式的品质因子、入射波频率和系数有关。在无耗散的光学周期结构中存在连续谱束缚态,即品质因子为无穷大的共振模式。由于共振增强倍数与品质
学位
关于函数空间上的算子理论研究发展到现在已经有百余年的研究历史,由于最近几十年学者们对其苦心孤诣的研究,逐渐成为了人们研究的热点,其理论研究最为核心的问题是如何通过符号函数的性质来刻画不同函数空间上的算子的性质.本文立足于Hardy空间进行研究,主要研究的是Hardy空间上Toeplitz算子与Hankel算子的乘积性质.由于这两类算子和函数论、Banach代数理论、算子理论等数学分支有着密切的关系
学位
远缘杂交是对现有品种遗传改良的重要途径,为了获得新的蔬菜种质资源,试验选用芸薹属A和C染色体组中重要薹用蔬菜菜心和芥蓝,进行种间杂交,通过胚挽救、增殖分化、生根诱导、人工诱导染色体加倍技术,得到菜心与芥蓝的种间杂种,并对获得的杂种F1及其自交后代F2进行形态学、分子标记、花粉育性、细胞学、流式细胞仪倍性、商品性分析等鉴定,主要结果如下:1.以菜心作为母本,芥蓝作为父本,进行种间杂交,一部分胚珠在田
学位
十字花科芸苔属作物是我国蔬菜、油料和饲料等重要经济作物的主要来源,在我国农业生产中具有举足轻重的作用。为追求高产,氮肥的盲目施用是该类作物栽培中普遍存在的问题之一,过量的氮肥施用造成了土壤板结、土壤结构变差、地下水硝酸盐污染等一系列问题。如何做到保证该类作物产量的情况下,减少氮肥的施用是芸苔属作物栽培过程中需要解决的关键问题之一。不同作物或同种作物不同品种间对氮的耐受能力不同,筛选和培育耐低氮品种
学位
在1986年,Kiselman证明了三维光滑凸紧集的二维投影的光滑性问题.在前人研究的基础上,我们继续对Steiner对称化的光滑性进一步研究,将凸紧集的光滑性问题推广到凸函数和凸体中,本文主要探讨C~1凸体和C~2凸函数Steiner对称化的光滑性问题,研究和解决了以下两个问题:1.在已经证明出来的引理:一个C~1凸函数的Steiner对称化也是一个C~1凸函数的基础上,将Sobolev空间中函
学位
半无限多目标规划问题是求解目标函数为向量值、约束函数个数为无限的优化问题.近年来,半无限多目标规划问题成为了数学规划新的研究热点问题,这是由于半无限多目标规划问题在金融投资、经济分析、军事决策、工程设计以及生态保护等领域有着广泛应用.本文主要利用切向次微分研究了非光滑半无限多目标规划问题近似解的强KKT条件、对偶定理和鞍点定理.主要内容如下:第一章简要叙述了半无限多目标规划问题研究的背景和意义,然
学位
1978年到2020年间,中国城乡居民收入比平均水平为2.62倍,近十年间平均水平为2.76倍,显著高于改革开放初期十年内的2.16倍,我国城乡居民收入水平仍存在较大差距。尽管近年来城乡收入差距有所收缩,但在国际形势紧张、新冠疫情肆虐等背景下,我国经济受到的下行压力不减反增,居民就业增收渠道同样受到来自多方面的限制。2021年国家十四五规划公布,明确将“城乡区域发展差距和居民生活水平差距显著缩小”
学位
在经济“新常态”大背景之下,市场竞争不断加剧,技术创新难度进一步增加,使得传统行业日益黯然失色;而发展多年的原有传统行业自身可挖掘价值有限,已经较难实现自我突破,迫使我国愈来愈多的传统公司开始探索转型之道。其中,跨界并购能够借助原企业的发展成果,迅速实现业务专业,获得新的盈利增长点,成为了众多传统企业的首选。而在各种行业中,教育行业受到许多投资者的青睐。教育行业有着宏观政策利好、特殊的逆周期性等特
学位
水源性传染病是水源遭受到病原体微生物的污染,并通过不洁水源传播而引起的一系列疾病.霍乱是一种典型的水源性传染病,是由于饮用了带有霍乱弧菌的水或者食物而引起的一种急性腹泻性传染病,具有发病急,传播快的特点,感染者若不及时就医,常常会有生命危险.本文以霍乱为例来研究水源性传染病,主要针对水源性传染病不但具有人与人之间的直接传播,还具有人与被污染水源之间的非直接传播这一多种传播途径的特点,构造偏微分方程
学位
亚洲栽培稻以籼稻和粳稻两个亚种为主,但其种内存在丰富的变异,是世界上最重要的粮食作物之一。水稻增产对保障我国乃至世界的粮食安全和提高人民生活水平具有极其重要的作用,但在很长一段时间以来,水稻产量出现了徘徊不前的局面。现阶段,籼粳亚种间杂种优势利用仍是水稻超高产育种的重要途径,然而籼粳亚种间存在生殖隔离,严重阻碍了亚种间杂种优势的利用。本研究既考虑到亚洲栽培稻以籼、粳亚种为主,又考虑到亚洲栽培稻种内
学位