SCAD-FLR模型研究及应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:mmg5fc1cc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Firth Logistic模型最早是由D.Firth于1993年提出的,旨在解决极大似然估计产生的偏差问题。极大似然估计方法是Logistic模型估计系数的经典方法,但是估计存在渐近偏差,尤其在小样本的情况下。Logistic模型的似然函数加上基于信息矩阵的惩罚项,得到Firth Logistic模型,可以达到“事前”预防偏差产生的目的。自Firth Logistic模型提出至今,有两种主流应用,其一,存在稀少事件的场景下Logistic模型估计的系数偏差很大,往往会低估事件发生的概率;其二,数据存在分离的场景下,最常见的警告是估计概率至少有一个趋向于0或者1,甚至会出现似然函数呈现单调性,导致算法不收敛或即使达到了迭代次数,返回估计值,也可能会存在某些估计系数趋于无穷的情况,此时的系数估计不再可信。Firth Logistic模型可以有效应对稀少事件或分离数据,并且总是可以得到有限的系数估计。本文首先通过数值模拟,探索发现小样本或稀少事件才是致使Logistic模型失效的原因,而非样本比例或样本的不平衡程度。同时,模拟完全分离和拟完全分离两种特征的数据,证明Firth Logistic模型的适用性。无论是小样本或稀少事件,还是分离数据,目标类事件的数量总是很有限的,客观上,对模型解释变量的数量就有所限制。因此,选择重要变量,构建稀疏模型就是一件必要且重要的事情。基于此,本文提出将 SCAD(Smoothly Clipped Absolute Deviation)惩罚纳入 Firth Logistic模型中,构建SCAD-FLR模型,实现稳定且合理的估计,同时进行变量选择的双重目的。本文借助五折交叉验证法选择最优参数,并使用Newton-Raphson算法进行最优化求解。通过全面且充分的随机模拟,考察模型的性能,并确定模型范式。最后,在真实数据中验证了模型的可用性和优越性。
其他文献
空间作为一切存在的基本和普遍形式已经变得本体化、绝对化,人们将其视为研究世界的工具,如今已经进入到诸如语言学、逻辑学等领域,这是人们对世界的认识范畴化的必然结果。本文
该品种金鱼古代早已闻名,在屠隆的《考檗余事》中也曾提及。鹤顶红金鱼全身洁白有光,体形宽短。头部着生的红色肉瘤高高耸起,或方、或圆,似仙鹤红冠,而且仅限于顶部,故名鹤顶红。尾
新冠肺炎疫情发生以来,在以习近平同志为核心的党中央领导下,全党、全军和全国各族人民众志成城,打响了疫情防控的人民战争、总体战、阻击战。在这场没有硝烟的特殊战争中,举国上
报纸
目的了解中山市开发区老年人高血压、高血糖、高血脂(三高)的流行趋势,并探讨其在不同人群中的特点以及高血压与高血糖、高血脂的关系。方法选取当地近4年(2015~2018年)接受
基于UGNX6.0软件平台,研究了海德汉双转台五轴后处理器的开发过程和方法。以哈默C20U五轴立式加工中心为例,详细地介绍了利用UG/Post创建海德汉五轴后处理的过程,并利用Veric
新冠肺炎疫情发生后,福州农业农村系统全力组织做好疫情防控工作,切实加强重大动物疫病防控,做好重要农产品稳产保供。15日,我市出台关于应对新冠肺炎疫情支持“菜篮子”产品稳产
报纸
<正>新营销是整体理念、模式、方法的重构。什么是营销?什么是新营销?营销简单说就是如何把产品卖给更多的人,如何让更多的人来购买更多的产品,并且能持续购买产品。以往做好
2009年福建省首次实行了新课程下的新高考。面对新课程和新高考,该如何进行更有效的复习呢?本文对第二轮复习提出了4点对策,供同行参考。
目的分析麝香保心丸辅助治疗冠心病心绞痛的临床效果。方法将94例冠心病心绞痛患者随机分为对照组和观察组,各47例。对照组给予常规治疗,观察组在此基础上给予麝香保心丸进行
绪言 乙种维他命(Vitamh-B-Complex)之发现,距今三十年有奇,在此期内,举全球之作有机化学或生理学研究者,几无不一作试验,以求证明是物之果为何,历观化学界及生理学界之近代
期刊