论文部分内容阅读
人类的疾病多为由遗传和环境因素共同作用引起的复杂性疾病。目前全基因组关联分析(Genome Wide Association Study)已经成功鉴定了上千种与人类复杂性疾病相关联的SNP位点。这些新发现极大地推动了医学和生物学的发展。随着各个国家科研人员持续深入的研究探索,GWAS也逐渐成为近几年研究的热点问题。 近年来,在GWAS研究中,全世界各个国家的科研人员已经识别了上千种SNPs和不同的性状或者疾病之间的关联性,并提供了实质性的内容了解疾病机制的信息。尽管关于基因与疾病的关联检验取得了长足的进步,但是GWAS中可识别与疾病关联的SNPs仅仅解释了基因变异的百分之几的比例,这就引出了一个问题即这些删失的遗传可以在哪儿以及怎样被识别,可能的解释包括以下几点:一方面,目前主效应不足以解释所有的遗传效应,许多研究已经证实了关联分析中存在交互效应,基于此,最近几年大量的检验统计量被提出来检验基因与基因之间的交互效应。另一方面,被广泛使用的检验基因之间交互作用或基因与环境之间交互作用的统计量功效一般比较低。例如常规的logistic回归方法,交互效应参数估计很不精确,且其检验识别力很低,因此提出一种高效的统计量来提高检验基因与基因之间交互效应的功效很有必要。 在病例对照实验中,对照组中基因满足连锁平衡(LE)与哈代温伯格平衡定律(HWE)条件下,本文推导出一个新的得分检验统计量来提高检验基因与基因交互效应的功效并利用δ方法计算出得分检验统计量方差的渐近估计。本文主要在二种不同的遗传编码方式下讨论基因与基因之间的交互效应是否存在,分别为1:G1,G2的主效应和交互效应均采用可加遗传编码。2:G1,G2的主效应采用共显性遗传编码而交互效应采用可加遗传编码。我们证明了在两种不同的遗传编码下,推导出来的得分检验统计量及其方差的渐近估计完全一样。最后的模拟部分显示,在两种不同的遗传编码下,我们提出的得分检验统计量相比常规的logistic方法具有明显的数值优越性。