论文部分内容阅读
极光激酶是丝/苏氨酸蛋白激酶家族成员之一,参与调节细胞的有丝分裂过程,如中心体、细胞骨架和胞质分裂的调节。哺乳动物细胞包含三种极光激酶亚型,分别为极光激酶A,B和C。由于极光激酶的异常调节会导致细胞的非整数倍,进而引起癌变,因此极光激酶被认为是癌症治疗的潜在靶点。
本工作第一部分采用自组织神经网络(SOM)和支持向量机(SVM)方法建立极光激酶抑制剂选择性分类模型。512个极光激酶抑制剂依据其对极光激酶A和B的抑制活性被分为三类:对极光激酶A有选择性、对极光激酶B有选择性和无选择性,并使用自组织神经网络方法划分为训练集和测试集。模型结果表明,自组织神经网络图能够较好的将抑制剂分到不同的区域中,而支持向量机模型也能很好的预测极光激酶抑制剂的选择性。此外,为了验证两种方法的表现,本部分工作还采用随机方法划分训练集和测试集,将重新组合的训练集用于建立SOM和SVM模型,测试集用于评价模型。两组SOM和SVM模型对测试集的预测正确率均高于87%,证实了两种方法的稳健性。这两组模型均可用于今后的极光激酶抑制剂选择性的虚拟筛选中。随后的工作使用ECFP4指纹图谱和构效关系分析方法总结极光激酶抑制剂与活性之间的相关性,研究发现几个子结构可能会对极光激酶抑制剂的选择性有一定的影响,这些子结构可能有助于药物学家进一步的研究极光激酶抑制剂。
本工作的第二部分,将研究对象转为679个极光激酶B抑制剂的高低活性,仍然采用自组织神经网络(SOM)和支持向量机(SVM)分类模型方法建立分类模型。数据集被随机的划分为包含482个化合物的训练集和包含197个化合物的测试集,并分别使用19个筛选的ADRIANA.Code描述符和166个MACCS指纹图谱表征化合物的分子结构和性质。最终结果表明,支持向量机方法建立的两个模型对测试集的预测正确率均高于91%,其正确率略高于用自组织神经网络方法建立的两个模型。实验还采用交互检验的方法验证两个SVM模型的稳定性,结果显示模型均表现出可信的交互检验结果。实验中采用的两组描述符,ADRIANA.Code描述符和MACCS指纹图谱,均能够很好地表征化合物的结构。结合分子对接模拟(Docking)的结果显示一些分子性质,如氢键相互作用和电荷相关性描述符,对极光激酶B抑制剂生物活性的重要性。
本论文旨在通过建立极光激酶抑制剂选择性和高低活性分类模型,对设计和研究新的致癌药物提供指导和帮助。