论文部分内容阅读
对于多个基因位点的高阶交互作用研究,经常会遇到参数维数高,然而样本量相对较小的问题。克服这个问题的一个方法是通过组合多位点基因型,将多个基因型合并成较少的类别,从而达到降维的目的。组合划分方法(CPM)、多因子降维法(MDR)等都属于这种方法。这些方法的一个共同特点是将高维基因型合并划分成K=2类,因而是最大限度的一种降维方法,但是对于多位点复杂的基因交互作用,划分成两类可能会丢失某些交互作用信息,因而合并基因型之后的统计检验可能会损失功效。本文提出并研究K-组合划分方法,并提出一种求解全局最优解的有序组合划分算法,该算法可将全局搜索的指数阶计算复杂度降低到线性阶。我们从理论上证明了所提出的有序组合划分方法得到的解,就是全局最优解,在logic回归框架下,通过模拟研究证实了所提方法的有效性和算法的高效性。