Lasso及其相关方法在多元线性回归模型中的应用

来源 :北京交通大学 | 被引量 : 80次 | 上传用户:comeon833833
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模型和变量(特征)选择是现代统计学中最重要的问题之一。本文比较了-元线性回归模型中变量选择的Lasso方法及其相关方法的优良性,并提出了一个新的求解Lasso估计的算法——随机模拟算法,该算法可以得到与最小角回归算法类似的结论。相对于一元线性回归模型,多元线性回归模型被更多地运用于实际问题中,但关于多元线性回归模型中变量选择方法的研究成果却很少。本文将Lasso方法及其相关方法的思想运用于多元线性回归模型的变量选择,提出了四种多元线性回归模型的变量选择的方法和一个多元随机模拟算法,并通过一个真实的糖尿病一元统计数据和一个模拟生成的多元统计数据,给出了变量选择方法的具体实现。本文在第一章介绍了Lasso方法在一元线性回归模型变量选择上的研究成果。并在第二章对其主要理论进行了简单的叙述。第三章介绍了两种求解Lasso方法的算法,并提出了一个新的随机模拟算法,然后用一个实际案例验证了这个算法的优良性。第四章简单介绍了Lasso方法的其他一些改进方法。第五章则将Lasso方法的思想引入多元线性回归模型中。并在第六章中用一个模拟生成的多元统计数据加以实现。
其他文献
回归分析是通过运用数据统计的方法,对大量观测数据进行一系列计算处理,从而确定所研究的因变量与一个或多个自变量间的定量关系,并最终建立一个函数表达式,在统计理论和实际运用
设G为有限p群。 若G的指数为p2的子群全交换且存在一个指数为pt-1的子群不交换,则称G为At群。 有一个极大子群是群的有限p群称为Al群。本文给出了至少有两个极大子群是Al子群
许多中年以上的人,对《为人民服务》可以说是耳熟能详。1944年9月8日,毛泽东发表了《为人民服务》,纪念张思德,弘扬张思德的精神,号召我们党所领导的革命队伍树立这种为人民
本文主要研究对象是基于p.Hall iscolinsim族p6阶的第一至第十家族群(Φ1-Φ10)上的有限非循环p-群.对于有限p-群的自同构群的阶的最佳下界的估计,有一个非常著名的猜想,即LA-猜
Weibull分布是可靠性研究领域中应用最广泛的一种统计分布模型,而三参数Weibull分布是Weibull模型中对数据适应能力最强、拟合效果最好的。但是由于该分布模型和正态分布、两
若G是阶大于p2的有限非循环p-群,则群G的阶是群G的自同构的阶的因子,这就是著名的LA-猜想,而满足LA-猜想的群叫LA-群.本文主要研究中心商等于P.Hall iscolinsim族2011家族的
计算机辅助设计(Computer Aided Design,CAD)技术是一种应用计算机系统对产品进行分析、优化和修改的设计技术.  SDRC公司提出了变量化设计、参数化设计,它们是CAD技术的主要
本论文对于Hamilton算子理论进行了多方面的研究,得到了一些相应的结果.  一.建立了无界2×2算子矩阵的乘法运算和伴随运算的一般法则,得出了算子矩阵自伴的充分必要条件.对
流动党员存在的现状在流动人才和劳动力队伍中,有相当一部分共产党员,他们被称为“流动党员”。调查结果显示,德阳市直机关各级党组织以及和市直机关各级党组织有一定工作关
有限P群G的指数为沪的子群称为G的&极大子群. d(G)表示G的极小生成系中元素的个数,知(G)表示G的不含Frattini子群的k极大子群的个数.当k= l,d(G)- I和d( G)时,本文给出了 Sk(