论文部分内容阅读
在流行病学研究、预防医学临床试验、金融学和其它的科学调查研究中,有些事件发生率很低,而对所有的研究个体进行协变量收集所需花费的成本往往很高,从而使得一些试验在实践中难以进行。在这样的背景下,学者们提出了成本节约型的试验来解决这个问题。在这一类试验中,研究者仅仅针对所有的发生感兴趣的事件的个体(病例)以及总体的一个随机子集进行协变量历史数据的收集。常用的两种成本节约型试验为病例队列试验(Case-cohort)和嵌入型病例对照试验(Nested case control,简称NCC)。病例队列试验在试验的开始即抽取一个随机样本,而NCC试验在每一个病例发生时的所有依然生存的个体中随机抽取对照样本。学者们对Cox模型、加法模型、比例优势模型、加速失效时间模型以及线性变换模型等危险率模型进行了病例队列试验的研究;对Cox模型、线性变换模型等危险率模型进行了NCC试验的研究。论文讨论基于广义的加-乘危险率模型的病例队列试验和NCC试验。广义加-乘危险率模型应用广泛,包含Cox模型(乘法模型)和加法模型。论文讨论如下三个问题:1.基于单变量的广义加-乘危险率模型的病例队列试验。由于不能完全观察到所有个体的协变量的信息,因而需要构造新的估计方程。论文以倒概率加权形式的估计方程对回归参数进行估计。在讨论参数估计的渐近性质时,主要运用经验过程的相关理论来证明估计量的相合性以及渐近正态性。论文考虑独立的贝努里抽样和分层简单随机抽样这两种常用的抽样机制,在这两种情况下分别对参数的估计和大样本性质进行研究。论文给出了累积的基准危险率函数和参数估计的极限协方差矩阵的相合估计以进行统计推断。论文使用Monte Carlo模拟试验来评价估计量在有限样本下的表现。在这一部分,对NWTSG研究数据进行统计分析,来阐述所提出的方法在实践中的应用。2.基于多变量的广义加-乘危险率模型的病例队列试验。多变量的生存时间数据在经济、财务、生物医学和其它的科学调查领域中的应用越来越常见。鉴于未知的相关性结构以及删失机制,对多变量生存时间数据进行分析通常比较复杂。基于多变量生存数据的成本节约型试验的研究是非常有限的。论文研究多重事件数据和聚类数据这两种常见的情形。在这两种情形下,分别构造了估计方程,并讨论估计量的大样本性质和统计推断过程。同样,在这一部分,使用Monte Carlo模拟试验来评价估计量在有限样本下的表现。通过对Busselton研究数据的统计分析来说明所提出的方法在实践中的应用。3.基于单变量的广义加-乘危险率模型的NCC试验。在这一部分,同样分贝努里抽样和简单随机抽样进行讨论。在每一种抽样机制下,论文分别建立了倒概率加权形式的估计方程进行参数估计,并且证明了估计量的大样本性质,讨论了估计量的统计推断过程。Monte Carlo模拟试验结果被用来评价估计量在有限样本下的表现。使用NWTSG研究数据来阐述估计方法的实际应用。论文的研究成果可以为医学临床试验、财务金融和社会调查的研究者提供理论依据和实践指导。