论文部分内容阅读
ABC (ATP-binding cassette)转运蛋白是一大类在众多器官中都有表达的跨膜蛋白。ABC转运蛋白能够阻止有毒物质进入细胞,从而达到保护细胞的作用。P糖蛋白(P-gp)是ABC转运蛋白家族最具有代表性的蛋白之一。P-gp结构为同源二聚体,每个单体由两束α螺旋和两个核苷酸结合区构成,分子量为170kD,由1280个氨基酸残基组成。P-gp与药物的结合口袋主要位于α螺旋区。核苷酸结合区的功能为与ATP结合,为P-gp与底物的结合与转运过程提供能量。研究表明,P-gp能够转运化学性质和结构多样性的药物,引起多药耐药(MDR)现象,导致癌症治疗的失败,此外,P-gp通过药物与药物相互作用,影响药物的吸收、分布、代谢和排泄(ADME)性质。因此,P-gp抑制剂和底物的研究对于癌症治疗和药物的ADME’性质具有重要的意义。论文的研究工作主要分为两个部分。在第一部分中,我们首次报道了迄今最大的P-gp抑制剂数据库,该数据库包括已分类为P-gp抑制剂和非抑制剂的1273分子。接下来,基于973个分子组成的训练集,我们采用递归拆分方法建立了P-gp抑制剂的预测模型,并用300个分子组成的测试集对模型进行了评估。最好的模型可以准确预测测试集中83.5%的抑制剂和67.0%的非抑制剂。最后,我们采用贝叶斯方法建立了预测模型。贝叶斯模型的预测精度明显优于决策树模型:贝叶斯模型对973个分子的训练集和300个分子的测试集的预测精度分别为81.7%和81.2%。我们发现引入分子结构指纹参数能明显提高模型的预测精度。此外,采用分子指纹建立的贝叶斯模型给出了一些对P-gp抑制活性具有较大影响的分子结构片断,分析这些结构片断对设计新的有效的P-gp抑制剂具有重要的价值。在第二部分中,我们收集和整理了包含822个分子的P-gp底物数据库,其中包含422个P-gp底物分子和400个P-gp非底物分子。首先,我们研究了常用的8种物理化学性质对P-gp底物和非底物的分类能力。其次,综合第一部分的P-gp抑制剂数据,我们得到了1157个分子构成的P-gp抑制剂和底物的数据库,并系统地研究了P-gp抑制剂和底物疏水性、氢键能力和分子大小方面的差异,并且采用对接方法研究了底物和抑制剂与P-gp结合的能力。此外,我们用贝叶斯方法建立了P-gp底物预测的模型,最好的模型对200个分子组成的测试集,预测精度均达到83%。同时贝叶斯方法给出了一些对P-gp底物活性影响较大的重要的片段,分析这些片段对设计新的P-gp底物有重要的意义。我们也讨论了一些分子被错误预测的原因。