论文部分内容阅读
不完全生存数据源于各个领域的实际问题。在生存分析中,事件发生的时间在某些情况下并不能精确地记录下来,而只能观测到属于某个区间内。这些数据称为区间删失数据。对于区间删失数据的处理,还没有很好的方法和方便使用的现成的软件。对于生存数据,一般很少使用参数方法,除非事先知道其分布。针对不同类型的生存数据,出现了不同的分析方法。生存分析是个活跃的研究领域,尚有许多问题值得去探索。
第一章是生存数据的概述。第一节陈述了生存数据的基本特征。第二节介绍了区间删失数据类型与相应的模型,并通过实例对不同类型的区间删失数据进行描述。第三节介绍了区间删失数据极大似然估计的self-consistent算法以及该估计具有的一些性质。
第二章着重讨论了一种混合区间删失数据生存函数的非参数估计方法。第一节从经验分布的思想出发,建立了生存函数,并给出了具体算法。第二节介绍了该估计的收敛性证明。第三节在特定条件下通过模拟研究,将该估计和self-consistent算法求得的极大似然估计进行比较,得出该估计的优良性。第四节把新算法和self-consistent算法应用于乳腺癌数据分析和艾滋病数据分析,然后运用bootstrap重抽样方法,显示新算法的稳健性。
第三章提出了两组独立的随机混合区间删失样本的比较方法。第一节介绍了假设检验的统计量χ2,并举例说明利用χ2统计量检验两组独立的随机区间删失样本。第二节通过模拟给出了该检验方法在不同情形下和不同样本量下的功效。
第四章研究COX模型在混合区间删失数据上的推广,分析所研究个体的各个协变量对生存时间的影响。第一节概述了经典的基于右删失数据的COX模型。第二节将COX模型推广到了混合区间删失数据。