论文部分内容阅读
特征筛选方法在统计学研究和其它科学领域中有着非常重要的地位,它的实用价值不容小觑。然而,随着科学的进步和互联网的快速发展,数据量日益庞大,且模型拟合日趋灵活和复杂。在很多科学领域中,以LASSO为基础的筛选方法已经不再适用。众多研究者在超高维数据中进行了深入地研究和探索,提出了一系列的筛选方法,然而,仍有很多问题需要解决。本文主要研究了超高维可加模型下的特征筛选方法,提出了以核函数为基础,并通过局部线性近似得到的估计方法。对于超高维可加模型,都可以运用此种方法得到良好的筛选结果。在一定的假设条件下,本文提出的方法有安全筛选性质。模拟结果也表明了本文所提出的方法拥有良好的筛选结果。本文主要内容分成四部分。第一章介绍了本文的研究背景以及实际意义。第二章主要讲述了近年来国内外学者在特征筛选方法方面的一些研究成果,分别为惩罚函数为基础的特征筛选方法;超高维线性模型下的特征筛选法方法;以及超高维可加模型下的特征筛选方法。第三章介绍了本文提出的筛选方法以及安全筛选性质和收敛性。第四章用Monte Carlo数据模拟进一步模拟本文中所提到的方法,并通过R语言实现。