论文部分内容阅读
在病例对照、医学随访等流行病学研究中,为排除可能存在的混杂或效应修正的现象,常常需要将数据进行分层分析。当流行病学研究中的分组变量与暴露因素变量均为二分类变量时,我们便可将数据写成多个2×2列联表的形式。在评估暴露因素与疾病间因果关联以及估计公共优势比之前,首先需要检验各层列联表间的优势比是否相同,即齐性检验问题。优势比齐性检验方法根据优势比估计方法的不同可以分为M-H方法、非条件似然方法和条件似然方法。文献[10,33]发现条件似然方法较其他两种有更强的功效,该方法假设列联表双边和固定,即2×2列联表中四个频数变量均服从(非中心)超几何分布。目前已有的依托条件似然方法的优势比齐性检验主要分为两类:第一类针对优势比自身进行建模,即检验原假设H0:θ1=θ2=···=θK,其中K为列联表个数(层数),但是发现这类方法的检验统计量自由度会随列联表个数的增大而增大;另一类引入分层变量信息,建立对数优势比回归模型,即令log(θk)=α+β′zk,k=1,2,···,K,其中zk为分层变量,β为回归系数,该模型下优势比齐性检验问题简化为H0:β=0.但是,我们可以发现,目前已有的对数优势比回归模型检验方法中,均假设回归系数β为一个固定值,固定β情况下的模型限制太强,容易产生模型错误,如果模型错误则会导致相应方法损失检验功效。因此,本文建立了对数优势比混合效应模型,针对回归系数β,在已有的固定效应基础上,增加随机效应,提高模型的灵活性。针对固定效应与随机效应构造相互独立的得分检验统计量,其优点在于不仅可以更方便的得到各统计量的极限分布,在实际运用中还可以运用统计量的独立性质分析优势比非齐性的具体原因。另外,针对常用于结合两个独立检验统计量的Fisher方法和Tippett方法,本文提出直接将独立统计量相加的求和检验方法,并在不同数据结构下进行功效比较,发现其较一般条件似然得分检验方法及对数优势比回归模型下的Wald检验和似然比检验方法相比具有较强的稳健性、高效性及泛化能力。最后,目前已有的方法都用极限分布来确定检验临界值,但是本文以及某些文献[10,33]发现这种方法在小样本情况下无法较好的控制第一类错误率,为此本文提出了一种Bootstrap方法,该方法不仅能较好的控制检验的第一类错误率,有效地克服了极限分布方法的不足,而且适用于文献中所有的优势比检验方法。