论文部分内容阅读
含指标项半参数回归模型是非参数回归分析中一类非常重要的统计模型,主要包括单指标模型、部分线性单指标模型、变系数单指标模型。这类模型的重要特征是将一个多元向量转化为一元指标,不仅有效地避免了“维数祸根(Curse of Dimensionality)"问题,而且仍能捕捉到高维数据的重要特征。因此,对此类半参数模型的统计推断是多元非参数回归的重要问题,是当前研究的热点问题,也是本文要研究的主要问题。首先,我们研究了单指标模型(Single-Index Model)指标参数的检验问题。单指标模型可表述为其中Y∈R是应变量,X=(X1,…,Xp)T∈Rq是协变量,α0=(α01,…,α0q)T是Rq上的未知指标参数且为了模型的可识别性满足‖α0‖=1,α0(·)是未知的可测函数,称为指标函数;误差ε独立于X且E(ε)=0和Var(ε)=σ2。在上述的半参数模型的检验问题中,通常的极大似然比检验可能不存在,主要是因为未知函数α0(·)的最大似然估计(Maximum Likelihood Estimator)并不存在,即便它是存在的,但其相应的极大似然比检验也不是最优的,为此,Fan et al.(2001)提出了广义似然比(Generalized Likelihood Ratio)检验,简记为GLR检验,并得到了非参数类型的Wilks定理,本文则利用GLR检验方法研究了单指标模型中指标参数α0的检验,建立了相应的GLR检验统计量,并证明了该统计量渐近服从χ2分布,不仅在含指标项半参数回归模型中揭示了新的Wilks现象,而且扩大了GLR检验的适用范围。我们的模拟研究表明所提出的检验统计量表现出了较优的功效。其次,在本论文中我们研究了部分线性单指标模型(Partially Linear Single-Index Model)的估计与检验问题,主要包括模型的剖面最小二乘估计(Profile Least-Squared Estimators)、指标参数与线性部分参数的检验。部分线性单指标模型首先由Carroll etal.(1997)提出并研究的,它是上述单指标模型的推广,可表述为其中Z=(Z1,…,Zp)T∈Rp是协变量,β0=(β1,…,β0p)T是Rp上的未知参数,误差ε独立于X和Z,其他条件同上面的单指标模型。本文提出了模型中未知量的剖面最小二乘估计(Profile Least-Squares Estimators),证明了所给估计渐近服从正态分布;建立在剖面最小二乘估计的基础上,利用GLR检验方法给出在一定限制条件下的指标参数α0和线性参β0的检验的检验统计量,并证明了该统计量渐近服从χ2分布,模拟例子表明剖面最小二乘估计表现较优,所提出的检验统计量的功效表现较好,揭示了新的Wilks现象。再次,在本论文中我们将研究变系数单指标模型(Varying-Coefficient Single-Index Model)的检验问题,主要包括指标参数、指标函数以及函数系数的检验。为了研究环境污染对呼吸疾病的影响,同时考虑到呼吸疾病的发病与气候有一定关系,五种空气污染物(二氧化硫、二氧化氮、一氧化氮、臭氧、可吸入的空气尘埃)和两个气候指标(温度、湿度)被认为是引起呼吸疾病的主要因素,Wong et al.(2008)引入了变系数单指标模型,即这里a(·)=(α1(·),…,αp(·))T是未知的函数系数,U∈R是一协变量,误差变量£与X、Z独立,其他条件同上面的单指标模型。他们探讨了这些因素对呼吸疾病的影响。由于单指标变系数模型中指标函数和系数函数具有不同的自变量,这些特点为模型的估计和检验带来了极大的困难。Wong et al. (2008)结合局部线性方法和回切技巧给出了该模型的参数和非参数估计以及估计的计算方法,并且讨论了它们的大样本和小样本性质,以及该模型在大众卫生方面的应用。而本文则利用GLR检验方法研究了关于此模型的指标函数α0(·)是否具有线性形式的检验问题,以及系数函数a(·)是否随协变量U可变的检验问题,也研究了指标参数α0的检验问题。本文证明了所提出的GLR检验统计量的渐近服从χ2分布,模拟与实际例子研究表明所提检验方法的有效性,揭示了一类新的Wilks现象。