论文部分内容阅读
在药物研究中,候选药物的生物活性和毒性是备受关注的两个重要问题。一是候选药物的生物活性,如与药物靶标的结合能力、抑制或激活能力。候选药物的生物活性越高,则其成功率越高。二是候选药物的毒性,如心脏毒性、肝脏毒性、肌肉毒性等。候选药物的毒性越低,则其成药机率越大。化学信息学中的多种技术,如自组织神经网络、支持向量机、聚类分析等,可以用于化合物结构与生物活性及毒性的关系研究。利用化学信息学手段,基于现有的庞大实验数据,可以解决药物研究中的上述两个问题。采用化学信息学的多种计算方法,本论文主要对以下四个方面进行了研究:(一)对水解酶和氧化还原酶催化的反应的分类研究:酶催化反应与药物在体内的代谢、药理和毒性密切相关。传统的酶反应分类方法是EC分类系统,该方法着眼反应的各种特征,如反应类型、反应底物、被转移的基团等。本研究基于反应中心断裂和生成的化学键,选择局部原子电荷差异、6-电负性差异、π-电负性差异、化学键的有效极化率、负电荷的离域稳定性和正电荷的离域稳定性6个描述符,采用自组织神经网络、支持向量机和聚类分析方法对水解酶催化的311个反应和氧化还原酶催化的651个反应进行了分类预测,预测正确率均大于90%,并且与EC分类系统一致。(二)对Src酪氨酸激酶ATP竞争性抑制剂和非抑制剂的分类研究:对Src酪氨酸激酶的抑制是前列腺癌、乳腺癌等多种疾病的有效治疗手段。本研究收集了686个Src激酶ATP竞争性抑制剂和1941个非抑制剂,基于23个物理化学描述符,利用自组织神经网络和支持向量机方法,进行了Src激酶抑制剂与非抑制剂的分类预测,预测正确率均超过98%。(三)对肌肉病变毒性和横纹肌溶解毒性的预测研究:肌肉病变毒性和横纹肌溶解毒性是他汀类药物的少见却比较严重的毒副作用,是他汀类药物的研究热点。本研究收集了232个引起肌肉病变毒性、117个不引起肌肉病变毒性、186个引起横纹肌溶解毒性以及117个不引起横纹肌溶解毒性的化合物,利用自组织神经网络和支持向量机方法,基于化合物的物理化学性质描述符,分别对肌肉病变毒性和横纹肌溶解毒性进行了预测,预测正确率均大于80%。发现原子电荷、电负性、极性等相关描述符与化合物的肌肉病变毒性和横纹肌溶解毒性有一定的关系;另外还分析了化合物子结构与肌肉病变毒性和横纹肌溶解毒性的关系,发现一些子结构能够更频繁或者只出现在引起肌肉病变毒性或横纹肌溶解毒性的化合物中。(四)对化合物生物活性极化的系统性分析和预测研究:化合物活性极化是指化合物的结构相似但其活性差异很大(通常定义活性差异,如Ki值差异,大于2个数量级),即结构上的微小改变对其活性有很大影响。目前,在化合物活性极化研究中,化合物结构相似性一般以分子指纹图谱的Tanimoto相似性值表征。在本研究中,首先采用子结构关系评估化合物的结构相似性,利用只有一个子结构不同的化合物对(即匹配分子对)来替代计算化合物的具体相似性数值,进行了化合物活性极化的系统性分析(只考虑Ki值小于10μM的化合物)。从BindingDB数据库中收集了包含至少5个化合物的621个不同生物活性数据集,基于匹配分子对,系统地分析了每个数据集中的化合物活性极化以及其频率。研究发现,在活性极化化合物对中,大小分别为5-8个和1-3个重原子的子结构相互转换经常发生,而且大部分数据集中化合物活性极化频率均比较低。其次,本研究还选择了黑素皮质素受体4(melanocortin receptor4)、凝血酶(thrombin)、腺苷a3受体(adenosine a3receptor)等9个数据集,利用支持向量机方法,进行活性极化匹配分子对的预测研究。设计了子结构差异核函数、子结构对核函数、匹配分子对核函数等新核函数。利用设计的新核函数,9个数据集的活性极化匹配分子对预测的平均真阳性率和F-score分别为86.2%和84.3%,平均精度和准确率分别为82.9%和95.8%。本研究中活性极化匹配分子对的预测是活性极化研究方面的首例。综上所述,本论文利用化学信息学方法对化合物的生物活性和毒性进行了计算研究。以上四个方面的研究均得到了良好的结果。