论文部分内容阅读
随着科学技术的进步与发展,一方面数据的收集与存储变得越来越容易,另一方面数据类型的多样性与复杂性也给数据分析工作者带来了巨大的挑战。可能高维的缺失数据就是这样一类复杂数据,在很多实际问题中经常遇到,比如在民意测验、市场调查、生物医学研究等领域尤为常见。这类数据的分析与建模必然呈现出“双重“的困难,即不仅要求处理好数据缺失问题,还要求解决好维数祸根问题。基于这两点考虑,本文致力于研究缺失数据下的充分降维方法与降维模型的兴趣参数估计问题。首先,提出了一种基于降维的核插补方法来处理协变量随机缺失下的充分降维问题,并证明了所得到的中心子空间的估计是根号n相合的。其次,当响应变量遭遇不可忽略缺失时,在一个相对灵活的半参数不可忽略缺失机制下,一方面提出了三种估计方程方法,即逆概率加权型估计方程、回归插补型估计方程以及扩张的逆概率加权型估计方程,来获得降维方向的估计,并证明了所提出的三种估计是相合的且渐近正态分布的,另一方面也研究了作为经典降维模型的部分线性单指标模型的估计问题,提出了一族具有“双稳健性”的插补估计方程来获得兴趣参数的估计,并证明了所提出估计的相合性和渐近正态性。也执行了大量的数值模拟来评估所提出的这些方法的有限样本表现。