论文部分内容阅读
本文主要研究了大维样本协方差阵(特别是在总体是spike模型下)的一些渐近性质,例如其线性谱统计量的中心极限定理,最大特征根的几乎处处收敛及渐近分布,最大特征向量的几乎处处极限等。第一章主要是关于随机矩阵,大维样本协方差阵及spike模型的背景介绍及现有结论的综述。第二章主要是对总体协方差阵的结构做假设检验。假设有一组p维的样本Y1,...,Yn,我们要做如下球型检验:H0:∑p=δ2Ip vs H1:∑p≠δ2Ip,其中的参数σ2是未知的。原假设表示样本K是不相关的并且具有相同的方差。我们记K的样本协方差矩阵为Sn=n-1∑iYiYi*,它的p个特征根为{li}1≤i≤p。在经典的大样本情形下(即维数p固定,样本量n趋于无穷时),假设样本来自高斯总体,有两种方法来检验以上的假设:一种是极大似然比检验(LRT),其统计量为样本几何平均值与算术平均值比值的幂函数:另一种是John在1971年提出的统计量:我们称其为John’s test。在原假设Ho下分别成立-2 log Ln(?)xf2和T2(?)χf2,其中χf2是一个自由度为f=1/2p(p+1)-1的卡方分布。总所周知,当维数p趋于无穷时,经典的多元统计方法会受到维数的挑战,因此我们这一章的目的就是改进这两个经典的统计量,使之适用于大维的框架。我们的研究框架是:p→∞,n→∞,p/n→y>0(LRT需要y<1)。我们证明了这两个统计量在原假设下都是渐近正态的:和其中κ是指示观测变量是实值还是复值的指示参数,β=E|xij|4-1-k。另外值得注意的是,这两个改进后的统计量在原假设下的极限分布都是普适的,它们只依赖于观测样本的前四阶矩,而与其具体的分布无关。第三章主要对spike模型下样本协方差阵线性谱统计量中心极限定理的中心化参数做了修正。我们假设总体协方差阵∑p的特征根是如下形式:这里M和重数(nk)是固定的,并且满足n1+…+nk=M。记Sn是对应这样一个spike总体的样本协方差阵,由于M是固定的,Sn的极限谱分布与没有spike的情况相同,还是δ1。考虑Sn的线性谱统计量:Xn(f)=p{FSn(f)-Fyn,Hn},根据线性谱统计量的中心极限定理,我们有(Xn(f1),...,Xn(fk))弱收敛到一个高斯向量(Xf1,...,Xfk,其均值和协方差与Sn的极限谱分布有关(与spike无关)。但是由于Fyn,Hn依赖于Hn,而Hn是总体协方差阵的经验分布,因此与spike有关,所以我们在这一章的主要工作是对Fyn,Hn这一项做了渐近展开,保留了其O(1/p)的项。作为一个应用,我们把第二章的球型检验限制在一个特殊的备择假设下:H1*:∑p∝spike结构(0.0.1),利用这一章的结果,我们可以得到第二章提出的两个检验统计量在这个特殊的备择假设下的势函数。第四章的主要结果是得到了几个随机半双线性型的联合中心极限定理。具体来说,对于l=1,…,K,我们定义其中X(l)和Y(l)是n维的向量,其元素满足一定的条件,An和Bn是满足一定条件的两个不同的埃尔米特矩阵(或者对称矩阵)。我们的主要结果是得到了随机向量(U(1),…,U(K),V(1),…,V(K))的联合正态性,并且给出了其协方差矩阵。其证明思路是证明其任意的线性组合收敛到一个正态分布,接着我们利用矩方法,只需要说这个线性组合的任意k阶矩收敛到这个正态分布的k阶矩即可。作为其应用,我们考虑了大维spike模型下两个新的问题:(1)样本协方差阵任意两组(甚至是任意有限组)极值特征根的联合分布;(2)样本协方差阵极值特征根及其对应的特征向量的联合分布。由于现有的文献如[7],[8],[10],[11]和[50]都是考虑单个的或者是一组(对应于同一个总体的spike特征根)样本极值特征根的几乎处处极限或者是渐近分布,另外还没有文献考虑spike模型下样本极值特征向量的渐近分布。我们这一章得到的结果可以看成是现有结论的一个推广(比如考虑(1)中的边缘分布,就能得到单个或者一组极值特征根的渐近分布;考虑(2)的边缘分布,就能得到极值特征向量的渐近分布)。第五章是对本文的一个小结。