论文部分内容阅读
近些年来,药物研发一直面临着高投入低产出的困境。通过研究,我们认为造成这种情况的主要原因是药物筛选使用的化合物库的设计太过依赖于组合化学方法,导致化合物多样性不够,及其不可预知的药代动力学ADME/T性质。为了解决上述问题,2009年我们提出了生物相关性(BR)的概念,用于定量的衡量一个化合物对生物体代谢的重要性及其来源于生物合成的可能性。之前的研究表明,该指标可以区分不同来源的化合物。同时,为了探索生物相关的化学空间,筛选具有良好ADME/T性质及生物活性的化合物,我们把在生物相关性的计算过程中目标化合物和生物相关代表性化合物数据库(BRCD)的相似性构成的一个2000维的向量定义为生物相关谱(BRS)。BRS给出了目标分子在生物相关空间中的分布,蕴含了重要的结构和活性信息。首先,本文使用主成分分析的方法对BRS的表征能力进行了验证,结果表明BRS具有很强的化学信息表证能力。随后利用MDDR数据库中的活性化合物及ACD数据库中非活性化合物的BRS构建了43个化合物活性预测模型(PoAct)。这些模型的训练集的平均精确率(Precision)达到97.03%,平均召回率(]Recall)为94.20%;测试集的平均Precision为92.30%,平均Recall为89.51%。从统计数据可以看出其预测准确度相当高,其充分说明了BRS具有很强的化学信息挖掘能力和表征能力。最后,为了便于使用BRS进行化合物筛选,本文还构建了基于BRS的用于评估化合物可能活性(PoAct)及吸收(HIA)、分布(BBB,NPL)、急性毒性(AcTox)的网络应用一-BioRel。它可以用来快速筛选可能具有良好ADME/T性质及生物活性的化合物,降低了使用BRS指导药物发现和设计的难度。