论文部分内容阅读
生存分析是临床试验和生物医学研究中的一个重要领域。生存时间数据来源于从一个确定的起点到事件发生的持续时间。本研究的主要目的是探讨在随机和受创随机临床试验中,积极治疗对生存结局变量的因果效应。因果推断理论可以用来衡量某一行为对感兴趣结局变量的影响。由于线性变换模型在确定协变量对生存时间的影响方面十分灵活,以及它与Cox比例危险率模型的关系,越来越受到人们的重视。本研究着重考虑治疗对生存输出的因果效应的评估及其相关的问题。而实际研究中,生存数据往往存在非正则性问题,例如删失,截断,协变量缺失,和时变协变量等。在估计因果效应时,这些问题对结果具有很大的影响,需要高度重视。如果忽视了这些问题,会导致最终的因果效应估计量是有偏的。除此之外,由于后随机化而产生的不依从性(或有或无依从性和部分依从性)是估计因果效应时遇到的另一个重要问题。本文对这些问题依次展开细致的研究。为了研究给定时变协变量情况下,处理对左截断右删失生存时间的影响,提出了基于半参数变换模型的因果效应估计量。生存分析中,已有一些学者对半参数转换模型进行了研究。与此类似,本研究中希望所提方法能够估计处理对感兴趣生存时间的因果效应。为了得到未知参数和未知变换函数的相合估计量,采用了修正后的估计方程。估计方程方法作为广泛使用的极大似然方法的一种替代方法,能够减轻由于时变协变量复杂特征而带来的一些复杂问题。当模型中同时考虑时变协变量和左截断时,极大似然估计过程变得更加繁琐和复杂。为了降低计算的复杂度,在半参数变换模型框架下,提出的修正的估计方程受到广泛关注。为了解决协变量缺失和随机化偏差的问题,研究中利用了倾向得分和线性化倾向得分逆概率加权估计方程技术。加权估计方程和倾向得分方法使得完全处理的因果效应估计结果更加可信。此方法的亮点在于利用半参数变换模型下的修正加权估计方程来估计处理生存结局变量的因果效应。此方法的新颖之处在于克服了因果效应估计时协变量缺失问题。在随机化偏差纠偏方面,该方法有望发挥很大作用。随机化偏差是采用倾向得分和线性化倾向得分进行纠偏,得到调整后的加权估计方程。通过线性化倾向得分纠偏后,得到最终的逆概率加权估计量。在随机缺失(MAR)条件下,利用核光滑方法得到非缺失概率的估计。除了上述问题外,在临床试验中,对处理分配的意外不依从现象更有可能使因果效应的推断复杂化。在存在或有或无依从性问题时,对给定的协变量和潜在依从类型,对于右删失时间的因果推断而言,有三个量需要进行估计,分别是:CACE(依从者平均处理效应),CESP(t)(时间t之前的依从效应)和CQCE(依从分位数处理效应)。根据三种情况下的理论分布,利用主要分层框架下的极大似然函数得到未知参数的估计。然而,使用通常的主要分层框架对部分依从性进行建模实为不易,因为分层的连续性特征会引起敏感的指定问题。因此,对部分依从性进行建模应用分层来得到处理效应估计时,需要一个很强的假设来保证可识别性。本研究考虑在齐次半马尔可夫模型框架下研究此问题。在齐次半马尔可夫模型下考虑了连续过渡时间的转移概率。对生存数据,在半参数变换模型下,采用马尔可夫模型框架。在或有或无依从性情形下,利用马尔可夫模型,结合指数分布的转移概率,得到参数的极大似然估计。将模型拓展到齐次半马尔可夫模型框架下,类似的可给出三个无条件被估计量和对应的条件被估量的估计。另外,本文通过模拟研究,说明了估计量的有限样本性质。此外,应用具有时变协变量和左截断及右删失生存数据的半参数转换模型对斯坦福心脏移植和MCPBC真实数据进行分析,表明良好的表现结果。对因果推断中协变量缺失情形下半参数变换模型的表现,目前仅做了模拟研究。在或有或无和部分依从性的情况下,没有做实际数据分析。最后,本文研究了如何调整由于处理的左截断和可能的时变协变量造成的偏差。通过估计左截断的密度函数,纠正了协变量造成的偏差。模型中还引入了左截断变量作为协变量,以放宽失效时间和截断时间的独立性假设。采用期望-最大化(EM)算法对未知参数和未指定的变换函数进行估计。此外,通过倾向得分和线性化倾向性得分对随机化偏差进行纠偏。在对模型中随机化偏差和协变量缺失引起的偏差纠偏后,通过主动实验和被动实验的累积风险函数的比值得出因果效应。