论文部分内容阅读
药物发现主要包括先导化合物的发现,先导化合物的优化,动物体内实验(临床前研究)以及临床研究。药物创新的源头是发现药物先导化合物,能否发现结构新颖且成药性好的先导化合物,是关系到一个药物创新项目成败的关键因素。先导化合物的发现主要有两种方式,高通量实体筛选(High Throughput Screening,HTS)和虚拟筛选(Virtual Screening,VS)。HTS的成本较高,实验周期较长,工业界平均筛选命中率较低,大约在0.3%左右。反之,虚拟筛选(计算机筛选),是在进行生物活性筛选的前面,利用计算机算法或者模型对化合物的活性进行预测,从而降低实际需要筛选的化合物数目,同时可以提高先导化合物的发现效率。所以,基于虚拟筛选的先导化合物的发现慢慢得到工业界和学术界广泛关注。抗癌先导化合物的虚拟筛选分为两大类:基于癌症靶标的结构的药物筛选(如分子对接)和基于配体的虚拟筛选(如活性定量构效关系,药效团,分子形状,分子指纹相似度等)。在后基因组时代,针对引起癌症的特定靶标,采用虚拟筛选可以发现一些靶向特异性的配体。毫无疑问,基于分子对接的虚拟筛选依赖于所要研究的癌症靶标的三维结构。但是,针对基于配体的虚拟筛选方法,绝大多数也都是以基于癌症靶标测试数据的计算模型来进行化合物库的预测和筛选,最常用的模型有药效团(Pharmcophore)和定量结构活性关系模型(Quantitative Structure-Activity Relationship,QSAR)。这主要与当下太过于强调药物靶标导向的研发模式有着莫大的关系。尽管很多基于癌症靶标的分子对接或者靶标测试数据驱动的预测模型发现了不少靶向的小分子配体,然而多数分子并没有显示细胞水平的抗癌活性。基于此发现,在前期研究中,基于NCI-60抗癌细胞活性大数据,采用多重机器学习方法,我们构建了高精度的抗癌细胞药物活性预测模型。采用所建立的抗癌细胞活性预测模型,我们进行小规模化合物数据库的预测和虚拟筛选研究,结合生物学测试,我们发现了高活性抗癌先导化合物(G03,IC50=2.82μM,人乳腺癌细胞系MDA-MB-231)。基于课题组前期开发的NCI-60抗癌细胞活性预测模型,本研究旨在进一步扩大其应用范围。首先设计基于NCI-60抗癌细胞活性模型为主的大规模虚拟筛选流程,对含有1738238个化合物的商用Chemdiv化合物库进行筛选。采用聚类分析、骨架多样性分析及经验筛选,最终遴选出68个化合物进行购买和体外抗肿瘤生物学实体筛选。生物学实验确证了17个有抗肿瘤活性的化合物。数据分析发现吡唑并[3,4-b]吡啶-6-酮骨架化合物(h2)显示较好的抗肿瘤活性。其次,基于h2化合物结构,采用基于分子指纹的相似度搜寻方法,对Chemdiv化合物库进行计算,遴选和购买61个h2结构衍生物。对所购买的61个h2衍生物做体外抗肿瘤测试,从而深入进行构效关系分析研究。结果发现高活性抗癌先导化合物B6和I2,其对MDA-MB-231细胞的抗癌活性分别为IC50=4.27±0.73μM和IC50=3.30±0.58μM。经过Discovery Studio指纹相似度计算发现它们是全新骨架抗癌先导化合物。同时,我们发现I2在耐药肿瘤细胞系也有很高的活性,在其较敏感细胞系耐阿霉素肝癌细胞系HEPG2/ADR的IC50为3.57±0.45μM。所以,我们进一步对抗癌先导化合物I2进行药效作用机制探讨,理论预测和实验验证结果表明:I2能够作用于微管蛋白,是微管蛋白的去稳定剂。此外,I2能够抑制MDA-MB-231细胞迁移,能够阻滞细胞周期于G2/M期,能够诱导细胞凋亡。