论文部分内容阅读
在本报告里,我们将要讨论几个当今热门的统计问题,其中包括:分片拟回归(SIR),分层分位回归(HQ),半参数回归模型的拟合欠佳(LACK-OF-FIT)检验以及m-相依随机变量序列的极限分布。具体地说如下: Li(1989)and Duan and Li(1991)曾经提出过一种多元数据分析的有效工具:分片拟回归。这是一种降维方法。令(Y,X)是一个(p+1)-维随机向量,Y∈R1且X∈RP。记Λ=E[Cov(X|Y)]。由于在实施分片拟回归的时候,关键的一步就是要估计Λ,所以,Li(1991)考虑过“两片”估计法,随后Hasing& Carroll(1992)导出了这一估计的渐近性质.另外,Zhu andNg(1995)则提出了另外一种估计.就这两个估计而论,前者由于分片过多而方差增大,后者则由于“分片个数”这个参数难以确定而使得应用起来比较困难。在第二部分里,我们提出了以拟残差为基础的一个新的估计,它可以克服以上估计的不足,同时我们研究了其渐近性质。 我们知道,分位回归是Koenker and Bassett(1978)提出来的。由于它有许多优点,所以很快就成了研究线性或非线性响应模型的综合性的统计分析方法。但是它不能有效处理具有分层结构的数据。很多时候,实际数据的这种分层结构既非偶然,又不能忽略,其实数据具有分层结构是种很普遍的现象。如果在数据分析的时候,忽略数据的这种结构就会冒忽略组效应之风险,甚至于使得研究数据的许多传统统计方法失效。众所周知,分层回归模型由于考虑到了数据的分层机构,所以有很多统计方面的应用.比如超散度研究(Cox1983),最小最大估计量的构造(Strawderman1971)等等。然而,分层模型实际上就是均值回归,所以当给定高维协变量之后,它们是不能完全刻划依赖变量的整个条件分布的。另外,估计出来的系数向量(又称边际效应)对依赖变量观测值中的离群点(outlier)很敏感。受到以上诸方面的启发,我们将在本报告的第三部分提出一种新的方法:分层分位回归。该方法以Gauss-Seidel迭代为基础,充分利用了分位回归与分层模型之优点。在理论方面,我们考虑了这种新方法的渐近性质,在简单条件下,得到了n1/2-收敛与渐近正态性.同时说明了如何应用到实际的数据上,以及如何解释所得的结果。 在本报告的第四部分,我们基于加权的残差与方差比,提出了一种自然而然的检验:半参数模型拟合欠佳(Lack-of-fit)检验。文章证明了该检验的一些样本性质.模拟显示:即使在小样的情形下,该检验方法的功效依然高。作为实际例子,我们将该检验法用到了Burning Ethanol数据上。 在报告的第五部分,我们证明了一个有关m-相依随机变量序列加权和的极大值的极限性质的定理.其实,在数理统计方面经常会遇到这些问题。该定理的优点就是:它不需要进行复杂的随机变量部分和的协方差的极限运算。所以在应用的时候,定理的条件容易验证。