论文部分内容阅读
非参数回归作为现代统计分析的主要方法之一,它对模型的假设很少,其最主要的优点就是模型具有稳健性,因此得到广泛的应用。非参数回归方法本质上是局部估计,当回归变量X为一维变量时,非参数回归函数用这些方法一般都能得到很好的估计。但当回归变量是多维时,由于X的局部邻域包含很少的数据,用这些估计方法,很难估计出一般的多元非参数回归函数,人们把这种现象成为‘维数祸根’(the curse of dimension)。可是实际中我们经常遇到的是高维数据,因此,高维数据分析是统计学家一直关心的问题。而变系数模型(Varying-coefficient Models)是解决‘维数祸根’问题的一个有效方法。
然而在现实问题中,如可靠寿命实验、医药追踪及生存分析等领域的研究中Y常常因为删失而不能被直接观测到。设C表示截断随机变量Y与C在给定U和X条件下是独立随机变量,记T=min(Y,C),Ti=min(yi,ci),δi=I(yi≤ci)(i=1,2,…,n),其中I(·)表示某事件的示性函数,当没有出现删失时δ=1,当出现删失时δ=0。们只能观测到{(Ui,Xi,Ti,δi);i=1,…,n}。由于响应变量存在删失,不能直接运用完全数据下的统计方法,因此需要对删失数据进行变换。
本文对删失数据采用的变换方法是Class-K方法即把数据点(U,X,T,δ)变换成(U,X,Y*)其中Y*=δφ1(U,X,T)+(1-δ)φ2(U,X,T)φ1(…)和φ2(…)为变换函数,且E(Y*|U,X)=E(Y|U,X)本文主要采用局部多项式回归这一非参数方法及Class-K方法对模型(*)在数据删失情况下进行回归分析。对模型(*)的系数函数光滑程度相同和不同时的情况分别进行详细讨论:
(一)当系数函数光滑程度相同时,用局部线性函数对其进行估计,并证明了其渐近偏差、渐近方差和渐近正态性。
(二)当系数函数光滑程度不相同时,一般的估计方法就不能达到最优收敛速度,于是就对光滑程度较高的系数函数用局部m次多项式进行估计,而对其它光滑程度较低的用局部线性函数对其进行估计。并证明了收敛速度、渐近偏差和渐近方差。