超高维数据部分线性模型的变量选择

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:a67987637
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
部分线性模型作为一类常用的半参数统计模型,既保留了线性模型直观、易解释的优点,同时又部分继承了非参数回归模型的稳健性特点,是线性模型和非参数回归模型的完美结合.部分线性模型一经提出,吸引了广大统计学者的关注,并涌现了大量的研究成果,其研究方法通常是结合参数回归和非参数回归常用的估计方法,从而导出参数向量和非参数函数的估计量,并证明所得估计量的大样本性质,为统计学开辟了一个重要领域,同时部分线性模型也成为经济、金融、生物医学等领域中处理数据的重要工具.但随着信息技术和计算机的高速发展,积累的数据日益增多,涉及范围也越来越广,高维数据逐渐被人们所认识并展开深入研究.高维线性模型的变量选择取得了大量的成果,然而,关于部分线性模型变量选择的文献相对较少,特别是超高维数据.本文基于profile最小二乘方法和regularization after retention(RAR)部分惩罚方法,提出一种新方法用于超高维部分线性模型的变量选择.所提方法的主要思想是先利用profile方法将部分线性模型转化为线性模型,根据边际相关系数估计保留一部分重要变量,然后对其余变量进行Lasso惩罚,可得到线性部分参数向量的部分惩罚最小二乘估计,并给出了实现该方法的算法.本文将惩罚方法用于超高维部分线性模型,为超高维数据的研究拓宽思路.方法中用到的部分惩罚方法提高了部分估计量的精度,也利于编程实现.在一定正则条件下,证明了所得估计量具有符号相合性.通过数值模拟和实例分析,将该方法与Lasso、SIS-Lasso、自适应Lasso进行对比,发现所提方法在恢复线性部分参数向量符号方面明显优于其它方法.
其他文献
<正>随着国际税收政策的不断完善,以粤港澳大湾区航运企业为代表的航海碳税制度正在向着多元化方向发展,在总体运营时间持续延长的前提下,与之相关的成本费用也随之增加,这不
鸡腺胃炎是一种以鸡的腺胃肿大、发炎为主要症状,伴随病鸡生长不良、消瘦、整齐度差等明显外观特征的一种综合性疾病。该病发生后,在同群内快速传播,几乎全群发病,死亡率极高
目前,农用薄膜的功能化和高性能化已成为农膜发展的主流,对功能农膜的质量、品种和性能都提出了更高的要求,且高性能功能农膜的研发已列入了国家农业科技发展纲要。在传统的
利用2011年和2016年辽宁省集体林改固定样本调查农户的一手调查数据,将农户林业收入按照辽宁省CPI指数折现分组,运用多元线性回归方法对两期农户单位面积林地收入的影响因素
目的:探讨恶性梗阻性黄疸经皮肝穿胆道引流和(或)胆道支架置入术影响疗效的相关因素。方法:分析2005年1月~2011年3月介入治疗的恶性梗阻性黄疸患者227例,根据患者的十余种临床信息
<正>证券公司作为中国金融市场主要的参与者和市场秩序的维护者,其大类资产配置结构变化及现状,将深受金融市场环境的影响,同时也可能成为决定未来金融市场走势的重要因素。
会议
纪念改革开放40周年的研究注重从多个角度总结社会主义与市场经济结合的经验,阐述中国特色社会主义经济道路选择、共识凝聚的历程。亲历者和经济学者的成果占据重要位置,改革
企业文化与CI作为现代企业管理的重要内容有着相互联系、相互促进的关系,但又各有侧重。企业文化注重企业内涵的塑造,CI通过企业理念的外化注重企业形象的塑造。CI设计通过塑
交际离不开语言和文化,有效的交际不仅仅是一个语言技巧的问题,还涉及到文化因素的方方面面.本文从人们的交际模式入手,论述了英汉语言中的文化意识对跨文化交际的影响,以及