线性模型系数错误发现率的估计研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:chen95127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现在社会正处于一个“大数据”的时代,生物、互联网等各行各业每天产生着大量的数据。如何从这些庞大的高维数据中尽可能最大程度的发掘信息为越来越多的人所关注,已经成为统计学中重要的内容。而当我们想知道多个变量的相关性时,我们自然想到应用线性模型求出回归系数,Lasso方法便是其中较为成熟的方法。它通过将部分系数压缩为零而提高了模型的准确度与可解释性,是对OLS等传统方法的较大改进。然而,Lasso方法在将部分系数压缩为零时,并不能确定它的错误率情况,以FDR测度来度量,也就是不能控制FDR。本文以FDR方法为基础,研究线性模型下多元变量的相关性系数的估计。我们最终提出一个关于其系数是否为零的判别过程,并从理论和数值实验两方面指出该过程能有效控制错误发现率(FDR),且在控制FDR方面优于Lasso方法。
其他文献
该文对Bernstein型算子的点态估计及其Steckin-Marchaud型不等式进行了研究
声源定位技术,就是通过声学的电子设备,检测并计算设备接收到的声音信号,来确定自然声源或非自然声源的位置信息的一门技术。它的研究涉及到声学、信号处理、电子学、模式识
该文研究了拓扑动力系统中的两个问题.一个零维紧致度量空间上存在可护同胚当该系统拓扑共轭于某个符号动力系统中的子转移.但符号空间的转移的不变子集的拓扑结构是一个极端
学位
在神经系统中,一般由集群中许多神经元的协同作用来实现神经信息的编码和处理,被称为神经元集群编码。科学界普遍认为,信息主要是由神经元发放的动作电位所携带。虽然关于动作电