【摘 要】
:
模型的变量选择问题是现代统计学中的一个重要问题,前人做了很多研究,特别是Lasso以及相关改进方法的研究已成为当今的热门问题.考虑到各变量间的次序作用,Tibshirani和Saund
论文部分内容阅读
模型的变量选择问题是现代统计学中的一个重要问题,前人做了很多研究,特别是Lasso以及相关改进方法的研究已成为当今的热门问题.考虑到各变量间的次序作用,Tibshirani和Saunders(2005)借鉴了Land和Friedman(1996)关于系数差分的惩罚,与Lasso的惩罚相结合,提出了Fused Lasso.这种方法不但满足了模型系数的稀疏性要求,而且实现了系数差分的稀疏性,产生一个分段平台式的解.本文将研究系数差分的平方和惩罚与Lasso估计的惩罚相结合的一种变量选择方法,即L2-2-Fused Lasso.这种方法既满足了模型系数的稀疏性要求,又实现了对系数差分的压缩,但不会将系数差分压缩为0.理论上,我们将研究L2-Fused Lasso估计是否具有Oracle性质;应用上,主要通过实例观察这种方法的表现,研究它与Lasso, Fused Lasso等其他变量选择方法的不同.本文首先介绍了研究背景和相关变量选择方法的发展状况.第二章主要是背景知识,介绍了线性模型和Lasso, Elastic Net, Fused Lasso这些变量选择方法.在第三章我们给出了L2-2-Fused Lasso估计的定义,并把它扩展为Lasso的形式,说明它可以解决p》n的问题.然后我们详细的证明了L2-2-Fused Lasso估计的渐近性,并对它是否具有一致性进行讨论,发现它在最优的收敛效率下,不具有一致性.第四章我们通过糖尿病案例和白血病基因案例两个实例来观察L2-Fused Lasso估计的表现,发现它在解决p》n的问题和变量间存在一定次序的情况时表现良好.文章最后对全文进行了总结,并提出了有待进一步研究的问题.
其他文献
本文在任意Banach空间讨论了有限个ψ-强伪压缩映射族隐迭代过程的收敛性问题。利用ψ的性质和迭代过程本身的特性,得到了不具误差和具有误差的隐迭代过程收敛于公共不动点的
本文主要研究时滞差分方程的振动性以及一类p-Laplacian边值问题多值正解的存在性.共分三部分内容. 在前言中,作者简单介绍了所研究方向的发展情况,提出了本文研究的主要问
本论文主要研究了具有非局部指数型非线性源的反应扩散系统解的整体存在和不存在性、临界指标,以及相关的关于奇性解的渐近性分析,例如blow-up速率、blow-up集以及boundary l
粗糙集理论是波兰数学家Z.Pawlak于1982年提出的一种有效地处理不完整和不确定数据的理论,其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。它
In this report we shall study submanifolds in (pseudo-)Riemannian geometry and Finsler geometry. In Chapter 1, we use Gauss map to study the topology, v
本文讨论发展障碍问题的移动网格有限元解法。障碍问题是变分不等式中重要的一类,可以用来研究自由或移动边界问题。移动网格有限元方法,作为有限元自适应方法的一种,主要是为解
In this paper, the consensus problem with position sampled data for second-order multi-agent systems is investigated.The interaction topology among the agents i
生物种群的生存问题已经成为当今社会关注的重要问题之一。近年来关于种群的生存性问题的研究受到越来越多的学者关注,对于确定性的生物种群系统已经有很多已知的结果。然而在
现代投资组合理论是由1990年度Nobel经济学奖得主Harry.A.Markowitz于1952年创立的。在这一年他发表了一篇题为“投资组合的选择”的论文。在这篇论文中,他指出收益和风险是