论文部分内容阅读
本文在广泛用于因果推断的基本理论--虚拟事实模型的框架中,主要研究不完全数据情况下基于协变量分层和主分层的平均因果作用的识别性。论文集中讨论两种情况:一种是作为分层的二值基线数据因死亡而缺失;另一种是平均因果作用条件在无法观测的主分层上。
第一章简单介绍了因果推断的发展情况并明确了本文涉及的一些基本概念和定义。
第二章是讨论二值基线数据缺失时平均因果作用的识别性。Frangakis et al。(2007)[12]证明了在强单调性假设下目标因果作用的识别性。这一章将其结论扩展到在两个更弱的假设同时成立时,包含潜在变量的联合分布都是可识别的,并给出了在不同假设下如何用EM算法得到极大似然估计的方法。在此章中,进一步证明了目标因果作用在没有那两个放松假设时是符号可识别的,并给出了其上下界。
第三章是提出通过引入一个处理前变量的方法来使主分层的平均因果作用能够被识别。证明了在单个处理后变量且单调性假设成立的情况下,每一个主分层平均因果作用都是显式可识别的。另外,此章探索性地研究了多处理后变量情况下目标因果作用局部可识别的问题。这里同样可以用EM算法得到极大似然估计。在此章和第二章中都用了数值模拟来展示所提出算法的效果。
在第四章中,用三个实际例子说明了第二和第三章中相应方法的实用性,并且阐明了能够将第三章中提出的方法应用到“结果变量死亡删失”问题里对“总是幸存者”人群平均因果作用的识别和估计中。
一些与本文相关的结论、探讨以及未来的工作写在最后一章中。