高维数据模型选择方法的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:ljlshh2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据模型选择在统计学中占有非常重要的地位,但传统的逐步回归法存在一些不足。Tibshirani,R.(1996)针对这一问题提出了LASSO方法,该方法很好的克服了传统方法的一些不足.但LASSO方法在高维数据模型选择问题上也存在一些不足,因此很多学者提出了改进,如:BICC和BICP方法(黄达,王汉生,2009),支持向量机(SVM)方法。   本文讨论了两种高维数据模型选择的方法,第一种,候选变量p远大于样本量n并且真实变量d小于样本量n的情况,文中简称为高维数据模型Ⅰ;第二种,候选变量p远大于样本量n并且真实变量d大于样本量n的情况,文中简称为高维数据模型Ⅱ。   本文将在前人的基础上,对于高维数据模型p》n的情况下进行模型选择。首先给出了高维数据模型的概念及其分类;其次给出了一些高维数据模型选择的方法和算法;接着具体针对高维数据模型Ⅰ的两种情况线性模型和非线性模型,用不同的方法进行数值模拟和效果比较;然后着重研究了高维数据模型Ⅱ,通过数值模拟,展示了LASSO方法,BICP方法与BICC方法的效果比较。结果显示,逐步回归与BICC的结合效果最佳,优于LASSO与BICP。最后给出了进一步需要解决的问题。
其他文献
心律失常危害严重,其中的室颤、房颤和心动过速更是有致命的危害。如何对心律失常做出快速,及时,准确的诊断是一个很有现实意义的问题。传统的心电信号分析多采用线性方法,有
图模型是图论、概率论,统计学等的交叉领域。图模型利用图这一比较直观的工具能够清晰地表示问题的背景知识及变量间的结构关系,是处理高维问题的有力工具。它广泛的应用于生
学位
本文主要研究了非Hermitian正定Toeplitz线性方程组Ax=b的预处理共轭梯度法。众所周知,若A是Toeplitz矩阵,那么A存在一循环与反循环分裂A=C+S,其中C为循环矩阵,S为反循环矩阵(记
本文针对非线性分数阶不规则边值问题以及非线性分数阶微分方程组,应用Schauder不动点定理、Banach窄间压缩映射定理、锥拉伸压缩不动点定理和Leray-Schauder择一定理对其解
子流形的微分几何学是一个内容十分丰富的分支学科,其中包含许多重要的研究课题,一直以来都是大家研究的一个热点.本文类比黎曼流形的子流形的基本公式和基本方程,通过引文中的
自然界中很多生物都存在着复杂的群集行为,如空中飞翔的鸟群,水中游动的鱼群,草原上奔跑的牧群,聚集而生的细菌群等,生物体以群体的形式协作觅食和躲避敌害,比单独行动具有更