【摘 要】
:
信贷交付是我国居民当今主流的交易方式之一,个人信用贷款不仅可以解决个人资金周转问题,也是近年来我国银行业盈利的核心所在。伴随着个贷业务规模不断扩大,违约事件发生频率却呈上升趋势,因此,准确高效地识别潜在违约风险,完善优化个贷违约预测模型,有助于加速银行业在个人信贷领域的健康发展。在以往的金融信用风控研究中,为了找出所有用户中少数类别即违约用户,研究者通常使用传统机器学习模型对违约用户进行分类预测,
论文部分内容阅读
信贷交付是我国居民当今主流的交易方式之一,个人信用贷款不仅可以解决个人资金周转问题,也是近年来我国银行业盈利的核心所在。伴随着个贷业务规模不断扩大,违约事件发生频率却呈上升趋势,因此,准确高效地识别潜在违约风险,完善优化个贷违约预测模型,有助于加速银行业在个人信贷领域的健康发展。在以往的金融信用风控研究中,为了找出所有用户中少数类别即违约用户,研究者通常使用传统机器学习模型对违约用户进行分类预测,在建模过程中未采用或仅采用了常规的特征筛选方法。因此,本文将聚焦于特征选择与不平衡数据的处理进行分类模型的构建。数据源于2021年CCF大赛提供的10000条个贷信息样本。在进行数据预处理后,设计组合式FIREF-ENET特征选择法,该方法第一步组合随机森林特征重要性筛选法和递归特征消除法,第二步再采用弹性网法进一步剔除冗余特征。与未进行特征选择和进行金融风控中常用的特征选择法皮尔逊相关系数法和信息增益法相比,组合式特征选择方法在分类准确率上有1.7%~2.6%的提升,F1值有18.7%~33.2%的提升。其次,由于数据集不平衡,对特征选择后的样本集采用随机欠采样、SMOTE过采样、Border Line-SMOTE过采样和SMOTE-Tomek混合采样四种方式分别构建平衡子样本。最后,基于逻辑回归和随机森林、XGBoost、Light GBM和CatBoost四种树类集成模型分别对四个平衡子样本建立个贷违约预测模型,并采用贝叶斯对参数进行调优。实验表明“SMOTE-Tomek+CatBoost”为最优组合模型,AUC值为0.880,F1值为0.589,召回率可达到0.885。并且基于该模型对特征计算SHAP值,进行重要性排序,对影响违约状况发生的关键因素进行分析。DGFISCSBCI哦为了进一步提高F1值,建立由SMOTE-Tomek采样法和双层Stacking模型组成的ST-Stacking违约预测模型。实验表明该模型可以大幅度提升F1值,达到0.903。再进一步验证模型在现实中可能面对的极度失衡样本集时的分类能力,对原样本集进行二次失衡化后再次实验,结论表明在采用SMOTE-Tomek采样法后,Stacking模型的准确率和F1值得到提高。证明基于FIREF-ENET特征选择法的ST-Stacking违约预测模型是理想的个贷违约预测模型。
其他文献
随着大数据时代的到来,亟需设计高效的机器学习算法来分析大规模数据。在实际情况中,数据通常由多个参与方生成。有些数据可能涉及到隐私等安全问题,数据存在孤岛和垄断现象,对需要大量数据完成训练的模型构建任务极为不利。数据的存储、安全和传输问题激发了区块链的研究。区块链科技在近年来也获得了多国政府部门的资金支持,且发展势头很快,其迅速发展也受到了社会各界的普遍重视。本文结合区块链和机器学习,设计了一种在H
随着2005年正式开始股权分置改革,市场迈入全流通阶段。不过,由于解禁股开始在市面中出现,大股东减持的状况频发,一些违规违法减持的现象也纷纷出现。现在国内的A股市场中一直以来具有炒作高送转这一不成文的惯例。一段时期以来,即便监管层逐渐更加严格地监管高送转,不过,依然还有很多企业想要钻监管政策空子,迎合投资者对于高送转的追捧,有计划地推出与其企业经营并不完全匹配的、存在缺陷的送转方案。在经过短时间的
印刷机在印刷行业中的地位至关重要,作为印刷行业中最核心和关键的设备,其运行的可靠性直接关系到印刷生产线的安全与稳定。随着印刷业的快速崛起,企业对印刷机的智能化的需求更加迫切。由于印刷机滚筒运行环境恶劣,滚筒轴承在长时间的运行过程中受到侵蚀,当轴承出现潜在故障时,会导致滚筒质量不平衡运转,使油墨转移精度大幅度降低。因此,滚筒轴承成为滚筒的关键性易损零部件,对凹印机滚筒轴承的准确诊断,对提高凹印机可靠
当前出版传媒企业在媒介融合趋势的发展下不断涌现与之相关的新兴业务,如电子书、有声读物、数据库等,在这种业务中形成的资产本文将其命名为媒介融合新型资产。由于企业会计准则并未对该种新型资产的会计确认与计量进行明确规定,致使不同企业对其有不同的会计确认与计量方式。这就导致出版传媒企业在该资产的界定与处理方面存在差异,使得行业内该资产的财务信息可比性较低,不利于媒介融合业务的发展。本文运用调查法对出版传媒
可食性涂膜保鲜作为一种高效健康环保的保鲜方法已在果蔬保鲜中得以广泛应用。目前可食性涂膜保鲜材料是以多糖、蛋白为主的亲水胶体材料,在涂膜保鲜剂以液体的形式应用于果蔬时,存在干燥时间过长、加快果蔬水分损失和容易被微生物滋生等问题。为了增强亲水胶体基可食性涂膜的表面疏水性,本文尝试利用晶体的多晶相变原理,将虫蜡(CWX)制备成固体脂质纳米颗粒(SLNs),研究了冻融过程中虫蜡晶体在表面活性剂水相溶液中的
日冕物质抛射(Coronal Mass Ejection,CME)是一种频繁且剧烈爆发的太阳活动现象,当抛射物抵达行星际空间时被称为行星际日冕物质抛射(Interplanetary Coronal Mass Ejection,ICME)。ICME会干扰地球的电离层、中高层大气以及磁场,从而在空间探索、卫星通讯、电网和电力设施等方面对人类的日常生活产生严重影响。目前,ICME的识别主要依赖于人工检测
目的 探讨“互联网+个案管理”模式在居家腹膜透析患儿护理中的应用效果。方法 采用便利抽样法,选取2020年1~12月于我院住院行腹膜透析治疗的66例患儿,采用随机数字表法分为对照组与试验组各33例,对照组采用常规干预管理,试验组在此基础上实施“互联网+个案管理”模式,比较两组患儿家庭管理疾病能力、患儿生活质量及并发症发生情况。结果 试验组的家庭管理疾病能力、患儿生活质量评分高于对照组,并发症发生情
电子商务的迅猛发展,使线上购物日渐成为人们生活的一部分,同时给快递行业带来了巨大的挑战和压力。末端配送是直接与消费者联系的最后一环,不仅需要满足时效要求,还要保证服务质量,末端配送的效率对整体物流效率有重要影响。网点作为末端配送的最后一个节点,快递员作为末端配送过程中连接网点和消费者的纽带,网点的运营管理能力和快递员的配送效率是提高整个末端配送网络效率的关键。当前,快递员劳动强度大、工作环境恶劣等
随着电子商务的兴起,快递业务量急剧增加。传统仓储仅靠人工完成货物搬运、分拣等工作已经无法满足庞大的快件需求,迫切需要借助智能化物流装备提高仓储运行效率。自动导引车(Automated Guided Vehicles,AGV)作为仓储运营体系中关键智能化装备之一,在减少物流成本、提高物流效率方面发挥着不可替代的作用。AGV的任务分配与路径规划算法作为AGV调度的核心技术,能够影响AGV运行时任务分配
黄慎作为扬州八怪之一,一直以其洒脱恣肆的人物画为人熟知,后人对其山水画、花鸟画及其书画互渗的艺术思想鲜有讨论。黄慎将书法作为其绘画的基础,其艺术成就的特点之一是以率性洒脱的草书笔意作画,使其绘画呈现出纷繁多彩的艺术面貌,如恣肆洒脱的写意人物画,形神兼备的花鸟画以及简笔率性的山水画。其艺术风格以书写意,随心写性,不受束缚,在以书入画的同时又将画意入书,将奇崛的画风渗透至书法中,使得书法的表现形式具备