基于平滑正则化逻辑回归的信贷风险研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:bigfish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着消费需求的激增和超前消费意识的形成,产生了大量的小额分散贷款需求,而银行的传统信贷业务并不能覆盖这些需求,互联网信贷因其贷款便捷性迅速在市场上铺开,但互联网信贷不像传统信贷有抵押和担保,其仅基于贷款人征信做出贷款审批决策,且由于互联网信贷市场发展初期的不规范性及相关法律的缺失,互联网信贷的风险极高,风险控制成为信贷机构面临的关键问题。由于信贷机构只会对审核通过的贷款申请(接受样本)放贷,因此最终只能获得接受样本的违约标签,而接受样本只是整体申请样本的一个有偏子集,模型迭代过程中仅基于接受样本建模会使模型过度拟合到接受样本上,使信贷风控模型对未来申请样本的预测精度面临挑战。
  信贷风控模型的理论研究和实践中一般通过拒绝推断技术降低模型的过拟合风险,即通过推断出拒绝样本的违约标签从而将打上标签的拒绝样本纳入训练样本进行模型学习,但拒绝推断模型的性能依赖于拒绝推断的准确性,若拒绝推断的效果不佳,那么拒绝推断模型的性能很可能会下降。
  本文跳出信贷风控问题的传统解决思路,从全新的视角校正样本选择偏差:鉴于短时间内客户的违约模式不会发生太大的变化,违约判别规则也不应发生太大变化,因此本文从控制信贷风控模型迭代优化的变化程度出发来避免模型的过拟合风险;本文通过引入正则化技术对传统逻辑回归算法进行改进,构建的平滑正则化项借鉴了经典的二范数正则化技术,通过控制信贷风控模型迭代过程中的差异使模型迭代平滑,以降低模型过拟合风险;通过平滑正则化项系数控制平滑力度,鉴于接受样本和拒绝样本的分布差异性,则对于接受样本和拒绝样本而言平滑力度也存在差异,因此本文采取差异化建模,即针对接受样本和拒绝样本分别建模并测试。
  本文基于融360平台提供的真实借贷数据集进行实证分析,实验结果表明,本文构建的平滑正则化项能够鼓励信贷风控模型的迭代平滑,并且验证了进行平滑鼓励得到的模型效果比不进行平滑鼓励得到的模型效果更优;另外,本文算法针对不用类型的测试集有不同的提升规律,验证了本文差异性建模和测试的合理性。本文算法基于接受样本验证集进行针对于接受样本的平滑正则化项系数的调整,基于经过重要性采样的接受样本验证集进行针对于拒绝样本的平滑正则化项系数的调整,对比本文算法、传统逻辑回归算法、常用的拒绝推断方法(硬截止法、模糊增强、打包法、重赋权法)的模型效果,发现本文算法的表现最优,相较于传统逻辑回顾有较大提升;拒绝推断方法在拒绝样本上能够获得的提升较大,然而对于接受样本而言提升较小,本文算法无论是在接受样本,还是在拒绝样本上都能够获得较大的提升。本文还尝试了将平滑正则化项与经典二范数正则化项进行融合,实验结果表明,二范数正则化项确实能够提升传统逻辑回归的效果,同时使用二范数正则化项和本文提出的平滑正则化项能使模型效果进一步提升,说明本文算法具有与传统的经典方法融合获得更大提升的潜力。本文提出的信贷风控模型迭代平滑的思想是一般性的,本文基于该思想对传统逻辑回归算法进行改进,该思想也可以迁移到其他分类算法中。
其他文献
【目的】在北疆独有的气候条件下,开展不同施氮量和基追比条件下滴灌甜菜地上和地下部分干物质积累、叶片光合生理特性、碳氮代谢产物及其关键酶活性的研究,目的在于明确氮肥调控下滴灌甜菜地上地下部分的生长规律、叶片光系统响应以及糖氮代谢特征,揭示氮肥调控下滴灌甜菜产量和品质协同提高的机理,旨在为北疆高产优质滴灌甜菜氮素管理提供理论依据。  【方法】试验以Beta356和KWS9147为供试材料,于2017和
学位
背景:越来越多的统计数据表明,随着环境污染等因素的影响,近几年的实体肿瘤发生率出现升高趋势,已经逐步成为影响着人类健康的重大疾患之一。就治疗方式的选择而言,目前对于多数实体肿瘤而言,其主要的首选治疗方式仍然是早期的手术治疗,化疗和放疗一般往往被用作辅助或保守治疗的手段,生物治疗和中医中药治疗也逐步体现出了重要的辅助或支持治疗作用。然而,国内外多数学者的研究结果表明,无论是化学治疗抑或是放射治疗,它
[目的]青光眼滤过性手术是目前治疗青光眼的主要手段,但术后滤过泡瘢痕化往往会导致手术的失败。在眼部,TGF-β2是参与创伤愈合和纤维化的重要调控因子,在滤过泡的纤维化过程中发挥了重要的调控作用。本实验应用干扰RNA方法抑制人胚胎眼Tenons囊成纤维细胞(HFTF)内TGF-β2的表达,以确定该方法能否抑制青光眼滤过术后滤过泡的瘢痕化,从而提高手术成功率。 [方法]将干扰RNA质粒p93
学位
目的:  在细胞水平,研究14-3-3γ蛋白参与内毒素耐受抗心肌细胞缺氧/复氧损伤的分子机制,即14-3-3γ蛋白是否将phospho-GSK3β靶向定位于胞浆完成对胞浆中β-catenin的调控,从而影响炎症因子的转录,进而起到内毒素耐受抗心肌细胞缺氧/复氧损伤的作用。  方法:  我们采用的是H9c2心肌样细胞,并构建体外的缺氧/复氧损伤模型。将H9c2细胞分5组进行实验操作:Control(
目的:  在细胞水平上探讨miR-128是否通过PTEN/PI3K/Akt信号通路调控DJ-1蛋白的表达,进而影响Ishikawa子宫内膜癌细胞的增殖、细胞周期、凋亡、侵袭迁移等生物学功能。  方法:  1.利用RealtimeRT-PCR技术分别检测正常子宫内膜组织、子宫内膜癌组织、正常子宫内膜细胞系ESC以及子宫内膜癌细胞系Ishikawa中miR-128、PTENmRNA、DJ-1mRNA表
目的:  研究木犀草素对LPS致H9c2心肌样细胞损伤的保护作用,并从线粒体自噬通路初步探讨其机制。  方法:  (1)为确定LPS在线粒体自噬水平上的变化,先采用蛋白质印迹方法检测细胞线粒体自噬蛋白LC3、P62及Beclin1的表达水平。再利用线粒体自噬抑制剂CsA在线粒体自噬水平上对心肌样细胞进行观察;通过CCK8检测细胞的存活率,LDH检测细胞活性,CK检测心肌损伤程度,qRT-PCR检测
学位
研究背景和目的:  他克莫司(Tacrolimus,TAC)是器官移植术后免疫抑制方案的一线用药,但它治疗窗窄,个体化差异大。此外,免疫抑制药物价格昂贵需终生服用,这给患者家庭带来沉重的经济负担。五酯胶囊是目前临床常用的他克莫司增效剂,但存在成分复杂,不易定量等缺点,五味子甲素(Schizandrin,Sch-A)是药典中标示五酯胶囊含量的主要成分。因此,探索新型他克莫司小分子增效剂具有实际的临床
学位
棘皮动物微管相关类蛋白4-间变性淋巴瘤激酶(EML4-ALK)融合基因被证实为肺癌的重要驱动基因,在非小细胞肺癌(NSCLC)中占3%~5%。针对该靶点的ALK抑制剂是当前抗NSCLC伴ALK阳性的重要药物,然而,耐药问题极大地限制了该类药物的临床应用。因此,开发不易产生耐药性的新型ALK抑制剂是目前研发的热点。  本文经研究发现,ALK抑制剂与组蛋白去乙酰化酶(HDAC)抑制剂联用,不仅可以发挥
目的:  探讨穿心莲内酯(Andrographolide, AD)对完全弗氏佐剂(Complete Freunds adjuvant, CFA)诱导关节炎大鼠的抗炎作用机制、氧化应激反应及中性粒细胞聚集作用的影响。  方法:  (1)动物模型构建及分组:在大鼠足跖皮下注射0.1ml CFA(1mg/ml),诱导建立SD大鼠类风湿关节炎模型,实验分为6组,每组8只:空白组,即正常对照组,适量1%羧甲
作为人工智能领域的一大分支,机器学习在近几年来一直蓬勃发展并不断的进行跨学科合作。在医学领域,医疗图像诊断、治疗查询和建议、医疗数据收集、药物发现、机器人手术等新鲜内容的涌现都得益于此。在所有医学病症中,癌症作为恶性疾病始终是医疗从业者努力的方向。肺癌在癌症排行中常年稳居第一,其中85%都是非小细胞肺癌(NSCLC),因此这是一个恶性度极高的癌症。鉴于非小细胞肺癌的高发病率,做好患者的预后成为了重