论文部分内容阅读
蛋白质-小分子结合位点是蛋白质表面行使蛋白质生物功能的活性位点,所以通常研究蛋白质的功能或者基于结构化的药物设计的第一步都是在蛋白质的表面准确的预测这种结合位点的位置以及结合位点周围的氨基酸信息。近20年来人们开发了很多的预测蛋白质-小分子结合位点的计算机算法,比如LIGSITECSC, PASS, Q-SiteFinder和SURFNET等。这些算法基于不同的角度对蛋白质-小分子结合位点进行了定义并依据其定义进行寻找。但是经过我们的对比,这些基于某个角度或者少数角度对蛋白质-小分子结合位点进行预测的算法其准确率往往不是很高,因此我们开发了一种新型的算法预测算法,将这些传统算法的预测结果进行科学整合,以求将通过对蛋白质-小分子结合位点的更加广泛而精确描述来提高预测准确率,我们称这种方式的预测算法为算法的算法,即宏算法(meta algorithm),而我们的这种预测算法叫做MetaPocket。在我们算法的第一个版本中(MetaPocket1.0)中,我们整合了LIGSITECSC, PASS, Q-SiteFinder和SURFNET这四种算法,并且达到了很高的预测效果。在本研究中,我们继续寻求更好的算法整合策略,对MetaPocket算法进行了优化,并且整合了另外四种预测算法Fpocket, ConCavity, GHECOM和POCASA,开发了MetaPocket2.0版本的算法,该算法在预测成功率上最多可以比传统算法提高12%。为了验证MetaPocket2.0算法对药物小分子结合位点的预测能力,我们还构建了一个只包含药物和其靶点蛋白质的“药物-靶点”数据集,该数据集为可药性预测等研究领域提供了一个测试标准。我们为MetaPocket2.0算法建立了一个功能强大的网络服务器以使其为其他研究人员服务。我们为这种宏算法提出了一种通用的程序设计模式,使用这种模式编写的宏算法程序可以具有极高的执行效率、极高的容错性和可扩展性以及易测试性。MetaPocket2.0网络服务器免费对学术界开放使用,网址为http://sysbio.zju.edu.cn/metapocket.