论文部分内容阅读
在统计实验中,如果观测到我们感兴趣的某种事件在某些个体身上多次发生,我们称该现象为复发事件。对这类现象进行观测,感兴趣的事件重复发生的次数、间隔等组成的数据称之为复发事件数据。复发事件数据经常出现在医学、公共卫生学、生物学、人口学和经济学等领域。近年来,针对复发事件问题的研究,现有文献提出了不同的模型与估计方法。归纳起来,对该问题的研究主要集中复发次数、复发时间、复发间隔等三个方面。其中现有文献对复发次数的研究最为广泛,然而现有的大多数关于复发次数的研究都是在协变量为低维的条件下进行的。随着计算机等信息技术的广泛应用,在生物学、医学等领域的研究中所获得的信息越来越复杂,涉及到的变量个数越来越多,即所谓的高维协变量问题,而这些高维数据背后往往隐藏着一些重要的信息,问题主要在于如何从大量的数据中提取有效信息,并且转换成决策所需要的信息。在很多领域,对这些高维数据的统计分析显得越来越重要,也是目前统计研究的热点问题。然而高维数据也给传统统计分析带来了很大的挑战,由于“维数祸根”的存在,现有的很多统计方法都遇到了前所未有的困难。在该背景下,本文研究协变量为高维情形下的乘积危险率复发事件和终止事件的联合模型的降维问题,从而比较完整地解决乘积危险率复发事件模型的降维问题。本文研究乘积危险率复发事件与终止事件的联合模型的降维问题。该论文创新之处在于我们用部分充分降维的理论和方法对乘积危险率复发事件的联合模型进行降维处理,我们既研究了复发事件的降维,也考虑了终止事件的降维问题。无论是部分充分降维理论与方法在复发事件降维中的应用,还是终止事件降维的讨论,这些都是值得研究而目前的文献中尚未关注到的问题。本文主要研究两方面的内容,第一方面:复发事件模型降维问题:首先利用非参数方法得到对复发事件模型的基准函数的估计,然后对高维协变量进行部分充分降维得到部分充分降维子空间,在基准函数非参数估计以及部分充分降维中心子空间估计的基础上,利用局部回归方法对复发事件模型中的回归函数进行估计,同时得到frailty因子的估计;第二方面:终止事件模型降维问题:在frailty因子估计的基础上利用两种降维方法对该模型进行降维处理:方法一首先对终止事件模型的变换模型高维协变量进行部分充分降维,从而得到部分充分降维中心子空间的估计,然后在部分充分降维子空间估计的基础上,利用局部部分似然方法对终止事件模型中的基准函数以及相应的回归函数进行估计;方法二利用有效估计的方法对终止事件模型进行降维以及对相应的未知函数进行参数估计。同时,本文给出了上述三种方法对应的数值模拟,由数值模拟结果,我们可以发现上述三种方法对模型进行了很好的估计。最后我们利用一组慢性肉芽肿病病人严重感染复发的数据进行了实例分析。