论文部分内容阅读
Wei,Lin和Weissfeld([105],1989)在Cox比例失效率(proprotional hazards,PH)回归模型的基础上,提出了一种处理多元生存数据的半参数回归分析方法,在不考虑生存时间之间的相依关系的情况下,假定各个生存时间分别服从Cox PH模型,在此基础上提出了回归参数的一种估计方法,即著名的WLW方法,这种估计不仅具有相合性和渐近正态性,而且方法易于实现.然而,由于参数估计的求解没有利用多个生存时间之间的相依信息,因而WLW估计的效率不高.如何提高WLW方法的估计效率,是多元生存分析中很重要的研究课题.Yang([109],2000)对这一问题进行了研究,通过对各生存时间的取值区间进行分割,得到了比WLW估计具有更高效率的估计.需指出的是,Yang提出的分割方法与样本量无关.为了更加充分地利用多个生存时间之间的相依信息,进一步提高估计的效率,我们提出了与样本量有关的分割方式,进而构造出涉及大维随机矩阵乘积的估计方程,并得到相应的估计.理论研究表明,在样本量趋于无穷,分割的最大步长以一定速度趋于0的条件下,这种估计不仅具有相合性和渐近正态性,而且其渐近协方差阵比任一固定分割所得估计的渐近协方差阵要小(在非负定矩阵的偏序意义下),从而进一步提高了估计的效率.利用与样本量有关的分割方式构造估计方程,在此类问题的研究中尚属首次,其渐近理论的研究具有很大的难度.为了证明渐近协方差阵的存在唯一性,需要利用再生核Hilbert空间(reproducing kernel Hilbert spaces,RKHS)的经典理论,由于现有理论用于研究随机过程仅涉及一维情形,我们将多个多维过程"拉直"为一个一维过程来处理,事实证明这是一种成功的分析方法.另一方面,在RKHS的经典理论中,取极限的方式是对递增的子集序列进行的(引理5.8),我们将它推广到步长趋于0的分割序列的情形(定理5.3).此外,研究中涉及的理论和方法还包括计数过程、经验过程、随机积分和鞅论等方面.本文还进行了大量的统计模拟,对有关估计进行了比较研究,并应用到两个具体实例.模拟结果显示,当多个生存时间之间的相依性较强时,新估计方法在小样本情形下也有良好表现.