论文部分内容阅读
在许多实际问题中,诸如生存分析、可靠性寿命试验、医药追踪试验等都产生大量的缺失数据.近年来,缺失数据问题在应用领域越来越引起人们普遍的关注.因此,对缺失数据的统计性质进行讨论具有很重要的实际意义.
本文的研究内容包括以下三个方面:
第一,由于非参数回归模型的回归函数形式可以任意,而且对随机变量的分布限制较少,因而在实际中有广泛的应用背景.因此,本文利用局部线性拟合方法给出了非参数回归函数的三个估计:完整数据的局部线性估计;加权估计和估计的加权估计.在适当的条件下,证明了三个估计量具有相同的渐近偏差和渐近方差,且三个估计量都渐近服从正态分布;并证明了它们都是弱相合的.模拟研究演示了它们的有限样本性质,并得出了估计的加权估计优越于完整数据估计和加权估计,而完整数据估计和加权估计基本一致.
第二,在第一部分的基础上,改进了局部线性最小二乘方法的不稳健性,给出了三个局部线性M-估计:完整数据的局部线性M-估计;加权M-估计和估计的加权M-估计.证明了三个M-估计有相同的相合性和渐近正态性.模拟研究演示了它们的有限样本性质,并得出了估计的加权M-估计优越于估计的加权估计.
第三,由于半参数回归模型既有参数分量,又含有非参数分量,兼顾了参数回归模型和非参数回归模型的优点,比单纯的参数回归模型或非参数回归模型有更大的适应性和更强的解释能力.因此,本文研究了半参数回归模型,利用局部线性回归拟合方法建立了缺失数据下半参数回归模型参数分量和非参数分量的局部线性估计,并基于参数估计量构建了方差的估计量.在适当的条件下,证明了参数估计量和方差估计量的渐近正态性,并证明了非参数估计量的最优弱收敛速度.
本文有如下特点:(1)研究对象是缺失响应变量的不完全数据,且满足MAR缺失机制.(2)研究了两个重要的统计模型:非参数回归模型和半参数回归模型.(3)本文采用了性质较好的局部线性拟合方法,为了提高稳健性,又给出了局部M估计方法.