基于自适应LASSO变量选择的Logistic信用评分模型研究

来源 :东南大学 | 被引量 : 10次 | 上传用户:collinne
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究的是信用评分模型中的变量选择问题,变量选择不仅是建模过程中需要考虑的问题,也是统计学研究中很重要的问题之一。在建模中不仅要确保选择的变量集合能反映所要研究的对象特性,还要保证得到的结果具有较好的拟合性和预测性。本文主要工作如下:一系统介绍了变量选择的方法:子集选择法和系数压缩法。子集选择法包括AIC值、BIC值和逐步回归法,系数压缩法包括岭回归、LASSO以及自适应LASSO.分析了信用评分模型的发展,变量选择在信用评分模型建立中的关键作用,以及国内外研究现状。二研究了Logistic模型的自适应LASSO变量选择和参数估计,核心是讨论将变量的信息价值作为自适应LASSO的惩罚项权重,以及证明其得到的参数估计量具有Oracle性质。由此构建了基于信息权重的Logistic信用评分模型。三进行了实证分析,主要通过对深交所148家中小企业以及30个信用指标体系变量进行以信息价值为惩罚项权重的自适应LASSO变量选择,建立Logistic信用评分模型,并利用发生比率来解释估计量的含义,并对选择的变量进行经济意义检验,可知模型包含的变量基本涵盖了企业的各项能力指标。最后并通过对比逐步回归法和LASSO两种变量选择法建立的logistic信用评分模型,利用ROC曲线、KS值、WGRP和CIER指标来比较验证三种模型的风险区分能力和估计准确性,得到自适应LASSO建立的Logistic模型要好于其他两种方法得到的模型,也表明了包含信息价值的自适应LASSO变量选择方法在实证检验中具有很好的表现。
其他文献
目的:分析糖皮质激素在儿科呼吸系统疾病中的应用现状及合理性。方法:选择2018年1~12月来本院使用糖皮质激素进行治疗的呼吸系统疾病患儿资料120例作为研究对象,按照用药的合
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
中西医结合是中医现代化的一大特色,是我国医学发展具有明显优势和重大组成部分。40年来,中西医结合治疗恶性肿瘤已取得较好的进展,无论是肿瘤舌诊研究,中西医结合对放化疗减毒增效
对于爆破作业而言,确保安全性以及相关爆炸物品的完整性可谓一大难题,也是其重点管控的问题.实际上安全事故与爆破作业的实施是并存的,鉴于各种不可控危险影响因素众多,运用
随着经济的发展,社会的进步,房屋建筑受到了广泛的关注.在当前形势下,城市化进程在不断加快,人们生活水平得到了显著的提高.在这样的背景下,人们对生活环境提出了高层次要求.
调查发现,微信交际快速、便捷的大容量传输功能,有助于学生开展线上、线下的学习。文章提出,在具体教学过程中,教师可选择内容相对简单、容易引起师生共鸣的唐诗为品读对象,
在全面调查分析武汉市名人故居与旧址的基础上,提出了实施总体保护、园林引导和文化提升的园林保护思路和原则,以及强化环境、系统保护,建园护宅、完善功能,控制视线、突出主体,彰
基站电费是移动电话运营商最大运行成本开支之一,根据作者多年的通信行业维护经验,本文介绍一种可行的技术改造方案,从而达到节约电费的目的.
文章以法国大革命为线索,初步探讨了政治革命产生的影响及其灾难性结果;然后转向善的革命即真正改革的历史意义的探寻;接着作者把话题引向了不改革的底线,即不改革或者恶的改
腹膜返折以下直肠癌由于没有腹膜包绕,故此段直肠癌易侵犯邻近组织和器官,并且侧方淋巴结转移是腹膜返折以下直肠癌的重要转移途径,淋巴结系统转移是影响直肠癌预后的重要因