论文部分内容阅读
从大规模相互作用网络中识别蛋白质复合物,对解释特定的生物进程和预测蛋白质功能具有重要作用,同时也是后基因组时代一个最重要的研究课题。由于在真实的蛋白质相互作用网络中,每个蛋白质可能属于多个蛋白质复合物。识别有交叠的蛋白质复合物是一个非常具有挑战性的研究课题。算法CPM(Clique Percolation Method)作为一种有效的识别复杂网络中交叠模块结构的算法在社会网络和生物网络中得到了广泛应用。但,CPM 算法应用于蛋白质相互作用网络时蛋白质复合物识别准确率不高,且不利于识别规模适中的蛋白质复合物。为克服CPM 算法的不足,本文通过引入距离限制约束识别的蛋白质复合物的规模,进而提出了一种基于团渗透和距离限制的蛋白质复合物识别算法CPM-DR。基于酵母蛋白质相互作用网络平台的实验结果表明,算法CPM-DR 比CPM 能够更准确、更有效、更全面的识别出具有特定生物意义的蛋白质复合物。