【摘 要】
:
身处科学技术高速发展的今天,我们的生活与数据息息相关,也可以说是数据组成了我们的生产生活的每一部分.我们每一个观察到的实例都包含着超大的信息量,甚至一个观测值就拥有着成千上万个维度.随着数据维数的增加,与之而来的问题就是如何整理和分析这些数据.其实对我们而言,这些数据并不全是有利用价值的,而如何从海量的数据中选择出我们想要的部分,高维数据分析应运而生.上世纪60年代初,变量选择被初次提出之后,就引
论文部分内容阅读
身处科学技术高速发展的今天,我们的生活与数据息息相关,也可以说是数据组成了我们的生产生活的每一部分.我们每一个观察到的实例都包含着超大的信息量,甚至一个观测值就拥有着成千上万个维度.随着数据维数的增加,与之而来的问题就是如何整理和分析这些数据.其实对我们而言,这些数据并不全是有利用价值的,而如何从海量的数据中选择出我们想要的部分,高维数据分析应运而生.上世纪60年代初,变量选择被初次提出之后,就引起了许多数学家极大的兴趣.1996年Tibshirani提出了Lasso算法,2001年Fan和Li提出了SCAD算法,该方法既保留了子集选择和岭回归的优点,又能产生稀疏解,保证了所选模型的连续性,又对较大系数具有无偏估计.同年,Breiman提出了随机森林算法,这是一种比较小众的算法,但是有很多优点,例如具有很好的稳定性和预测精度,也可以对解释变量的重要性进行排序.2006年,Zou提出了Adaptive Lasso方法.由于Lasso对于每个系数的压缩大小是一样的,Adaptive Lasso方法针对这一缺点做出了改进,并且被证实具有oracle性质.Nicolai Meinshausen在2007年定义了一个Relaxed Lasso估计,并且提出了用于计算Relaxed Lasso估计的两阶段算法.本文结构划分如下:第一章介绍了变量选择问题的研究背景以及国内外研究现状,并对本文的研究内容做了简要阐述.第二章介绍了一些预备知识.第三章介绍了近些年所提出的变量选择方法,并列出了这些方法的优缺点.第四章介绍了一个新算法.第五章利用Lasso算法对国内生产总值数据,居民人均可支配收入数据以及出生率数据进行了建模以及变量选择.第六章对本文进行了总结.
其他文献
非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法,是运筹学的一个重要分支。20世纪50年代初,库哈(H.W.Kuhn)和托克(A.W.Tuc-ker)提出了非线性规划的基本定理,为非线性规划奠定了理论基础。这一方法在工业、交通运输、经济管理和军事等方面有广泛的应用,特别是在“最优设计”方面,它提供了数学基础和计算方法,因此有重要的实用价值。本文研究的最速下降法就是解
最优控制这一思想已经伴随人们的生活很多年了,一直在无形中影响并指导着人们的生产和生活,只是在很长的时间内最优控制没有形成理论,直到上世纪40年代,维纳在[42]中第一次提出了最优设计的概念,控制思想开始以理论的形式呈现在人们面前.60年代,人们首次明确提出了状态空间模型的标准形式,最优控制理论取得了前所未有的发展.在工程、生物和经济等领域的最优控制问题中数学模型往往是离散的,我们在用计算机解决连续
本文主要给出了Hom-预李代数的阿贝尔扩张的概念,并且用上同调群给出了它们的分类,证明了同构的阿贝尔扩张与二阶同调群的不动点集一一对应.之后研究了Hom-李代数的阿贝尔扩张与Hom-预李代数的阿贝尔扩张的关系,证明了一个Hom-预李代数的阿贝尔扩张可以自然给出一个Hom-李代数的阿贝尔扩张.全文共分为三章.在第一章中,我们介绍了研究课题的历史进程,相关方向的研究内容及其进展,之后介绍了本文的研究目
本文研究了一维空间中自由边界区域上的具有Lotka-Volterra型弱竞争项的抛物-抛物-椭圆型趋化系统的数值逼近问题。这种具有自由边界的趋化模型描述了受到某些化学物质影响的新物种或者入侵物种,在一个具有扩散前沿(即自由边界)的环境中的扩散情况(见[1])。数值研究的主要挑战在于追踪移动的自由边界以及处理由于趋化效应而存在非线性项。为了克服这些挑战,我们引入了有限差分法与向前差分格式相结合的方法
本文研究了一类具非线性反应项的一维退化抛物方程的初边值问题的零可控性,问题如下:ut-(xαux)x+μ(x,t)ux+p(x,t,u)=h(x,t)Xω,(x,t)∈ QT,u(0,t)=u(1,t)=0,t ∈(0,T),u(x,0)=u0(x),x ∈(0,1),其中 0<α0,QT=(0,1)×(0,T),μ ∈ L∞(0,T;W1,∞(0,1)),p是(0,1)×(0,T)×R
本文研究如下具有特殊扩散系数的非线性抛物方程解的爆破性质(?)(0.1)其中Ω Rn(n≥ 3)是具光滑边界(?)Ω的有界区域,0∈Ω,Δpu=div(|▽u|p-2▽u),20,k(t)≥ 0,
在本文中,我们研究如下癌症入侵模型(?)其中Ω(?)R2是光滑有界域,x,ξ,η和μ是正参数,我们对它附加零流量边界条件.这个方程组是一个趋化趋向模型,描述了癌细胞入侵组织过程中,癌细胞,基质降解酶和宿主组织间的相互作用.系统中η反映了细胞外基质的自我重建过程.本文的目的是建立上面模型初边值问题解的存在性.首先,借助不动点定理得到解的局部存在性.然后利用Young不等式、Cauchy-Schwar
复杂网络在现实生活中十分常见,如互联网、社交网和交通网等。许多的实际问题中,网络与网络之间是互相影响的,因此多层复杂网络之间的相互作用引起广泛地关注。网络的同步现象在自然界中广泛存在,一直是学者们较为关心的问题。随着多层复杂网络理论的发展,多层网络的广义同步也受到广泛地关注。目前有关多层网络广义同步的研究大多基于Lyapunov函数理论,通过辅助系统方法和线性矩阵不等式方法等,选取一定数量的节点加
本文中,我们首先研究了高阶的CH-NS方程组的初边值问题,通过对方程组的离散化和能量估计,我们证明了解的存在性,并给出了最优控制问题解的存在性.之后讨论了相关的伴随系统,并给出了相关的结论.然后我们研究了如下的耦合的油,水,表面活性剂和Navier-Stokes方程的初边值问题:这里f(c)=F’(c),F(c)=(c+1)2(c2+h0)(c-1)2,a(c)=a2c2+a0,其中Ω(?)Rn,
目的评判前置胎盘行剖宫产手术之后出血产妇接受针对性心理护理干预措施的护理效果和满意程度。方法本课题针对2018年7月~2020年11月本院妇产科纳入的62例前置胎盘行剖宫产手术之后出血产妇实施有关指标方面的调查,依据随机抽签的方式将其分为两组,各31例。试验组选用一般护理干预措施叠加针对性心理护理干预措施,参照组选用一般护理干预措施,对比两组干预前后的抑郁负性心理评分以及护理满意率。结果两组干预前