论文部分内容阅读
病例-对照设计是基因关联分析的一种有效方法。然而,潜在的群体结构(群体分层和群体近亲婚配)可能会导致假关联从而影响检验的Ⅰ型错误和功效。为纠正此错误,统计学家们提出了基因对照方法(GC)和δ-中心化方法(DC)来分别修正群体分层(Ps)和群体近亲婚配(CR)带来的影响。这两种方法被很多文献证明是有效的并在遗传学中有很好的运用。在本文中,我们提出并研究了基于GC和DC方法的三种稳健性检验。除此之外,我们还将DC和GC方法结合,提出了一种新的修改群体结构的方法,称为中心化的基因对照方法(CGC)。
无论是GC还是DC都基于特定的遗传模型的假设。然而,在很多复杂疾病情况下,遗传模型通常未知,故此我们提出了三种稳健性方法并研究了它们在各种不同情况下的表现。我们的结论是:在遗传模型不可知时,三种稳健性方法的功效要大大优于选错模型的GC或DC检验的功效。除上述结果以外,我们还发现,在CR影响下,GC比DC表现好很多;在PS影响下,DC优于GC。然而在实践中,很难通过给定的病例-对照数据来确定其究竟属于哪一种群体结构,故提出一种能同时修正PS所带来的偏差和CR带来的方差偏离的方法是十分必要的。故此我们提出了一种叫做中心化的基因对照方法(CGC)。此方法的特点是其融合了GC和DC方法因而能同时修正Ps和CR带来的影响。我们的研究表明,无论是在哪种群体结构的影响下,CGC检验的表现总是令人满意的。