论文部分内容阅读
在药物研发过程中,造成药物研发成功率较低有多种因素,主要可以总结为两类:一类为药物候选化合物物的物理化学性质及体内吸收、分布、代谢、排除及毒副作用(Absorption, Distribution, Metabolism, Excretionand Toxicity,简称ADMET);另一类为药物对于靶标的结合活性及选择性。化学信息学中存在的多种技术手段,可以利用药物研发中存在的海量的实验数据和理论数据信息,解决上述药物研发中的问题,提高药物研发的效率和成功率。从利用化学信息学手段解决药物研发中存在的实际问题出发,本论文工作可总结为三个方面:(1)在药物ADMET的重要性质中,选择生物利用度,血脑屏障透过性,P型糖蛋白底物识别及hERG抑制毒性等药物研发中关键的性质进行建模研究。在生物利用度的建模研究中发现在引入肠吸收实验数据作为输入后能够提高通用模型的预测能力,另外发现对特定类别药物化合物建模能够取得不错的效果,并分别针对磺胺类药物,β内酰胺类药物,血管紧张素转换酶抑制剂和血管紧张素Ⅱ受体拮抗剂,钙离子通道阻滞剂,钾离子和钠离子通道阻滞剂,喹诺酮类抗菌剂以及中枢神经类药物分别使用多元线性回归方法及支持向量机回归算法,建立生物利用度预测模型,取得良好的预测结果。对于血脑屏障透过性分别进行了定量预测模型和定性分类模型的建模研究。定量预测模型基于188个化合物的数据库,建立支持向量机回归模型,该模型对训练集化合物预测结果的回归系数r=0.92,对于测试集化合物预测结果的回归系数r=0.85。同时基于1593个定义了血脑屏障透过性的化合物,建立了自组织神经网络模型和支持向量机分类模型。所获得模型对训练集及内部测试集的分类正确率均达到90%以上,对外部测试集的分类正确率在80%左右,可以应用于药物研发中的虚拟筛选工作。关于P型糖蛋白底物预测研究,本研究建立了比以往研究更大的数据库,包括332个P型糖蛋白底物和非底物。所有支持向量机分类模型中最好的模型对测试集的预测正确率为88%,Mathews相关系数为0.73,表现出了可靠的预测能力。对于hERG抑制毒性的预测研究,使用基于概率的多类分类方法建立预测模型,该模型提供化合物预测为属性类别的概率,使用者可自行设定概率阈值做出毒性判断。应用所建立的模型从506个FDA药物中预测出19个药物成为阻滞剂的概率很高,其中12个属于训练集中已知阻滞剂,剩下7个化合物中有4个已经被实验证实为阻滞剂,另外3个则需要被实验证明。(2)由于一些他汀类药物因肌炎和肌病等副作用而退市,增加了对新型3-羟基-3-甲基戊二酰辅酶A还原酶(HMG-CoA还原酶)抑制剂的预测需求。本研究使用自组织神经网络方法建立HMG-CoA还原酶抑制剂虚拟筛选模型来区分底物和假阳性非结合物,取得了显著的效果。之后使用含有32个底物和1103个非底物的外部测试集来检验虚拟筛选模型效果,最终84.4%的底物被找到而且只有15%的假阳性化合物被发现。由此可见所得到的模型具有较好的的可靠性,并可以用来进行真正的大规模虚拟筛选,寻找HMG-CoA还原酶的新型抑制剂。(3)Apelin是孤儿G蛋白偶联受体APJ的天然配体,为了设计出针对Apelin受体的激动剂和拮抗剂,并探索该受体涉及到的生理作用以及潜在的治疗作用,通过分子动力学模拟方法,提出了受体配体的识别与结合机制,受体的激动机制和拮抗机制,并设计了一系列Apelin肽链类似物进行实验验证,实验结果很好的说明了研究中提出的关于识别机制、激动和拮抗机制的假设。同时基于Apelin的两段序列RPRL和PMPF建立了药效团检索进行虚拟筛选,分别得到一些活性小分子化合物,但由于活性较差,仍需要进一步对小分子结构进行改造,并对药效团模型进行优化。综上所述,本论文研究工作应用化学信息学的技术手段针对性的解决一些药物研发中的热点问题,展现了化学信息学在当今药物研发领域所发挥的重要作用,为推动药物研发中传统方法的革命并加速药物研发的进程做出了应有的贡献。