论文部分内容阅读
药物构效关系研究是当今制药领域的一项重要课题,在现代药物设计方法中具有非常重要的地位。定量构效关系(QSAR,quatitativesstructure-activity relationships)研究的目的是采用数理统计的方法来研究和揭示化合物活性与其分子结构的关系,为药物的开发提供了崭新的思路,从而提高了开发效率。支持向量机是一种有效的人工智能学习算法,在有机化合物及药物构效关系的研究上,显示了其具有较高的分类和预测准确率。本论文第一部分主要对烷基苯的几个重要物理化学性质,包括热容(C_p)、焓值(△H_f~0)和燃烧热(H_c)进行了预测,并建立了相关的定量预测模型。由于每一个烷基苯在苯环上都有六个位置可以取代,所以我们利用含有六个数字编码的方法来描述烷基苯的结构。通过多元线性回归(MLR)、多元非线性回归(NLMR)和支持向量机(SVM)的方法来建立预测这些性质的定量构效关系模型。这些模型显示出了很好的预测能力,所有模型的相关系数(R)都在0.97以上。对于热容模型的三种模型,均方根误差(RMS)均小于12,平均绝对误差(MAE)均小于8;对于焓值的三种模型,均方根误差小于9,平均绝对误差小于8;对于燃烧热的三种模型,均方根误差小于150,平均绝对误差小于130。三种建模方法中,支持向量机模型不论在烷基苯热容、焓值还是燃烧热的建模中,都优于其它两种建模方法。本论文的第二部分,针对1293个有机化合物的水溶解度值建立了分类和定量构效关系模型。有机化合物的水溶解度是一个重要的ADME性质,它可以决定化合物的生物利用度和生物活性,从而决定该化合物成为药物的可能性。能否根据人为设定的大致溶解度范围对其进行分类,对于药物的初步筛选具有重要的参考价值。在此基础上,较为准确的预测有机化合物的水溶解度对于备选药物的深入研究具有极其重要的意义。采用18个拓扑描述符来描述1293个化合物的分子结构。首先建立了1293个有机化合物的支持向量机分类模型,按照前人提出的大部分药物的溶解度标准,将这些有机化合物按照水溶解度的大小分成三类,得到了92.2%的分类准确率。在此基础上,进行了水溶解度的定量研究,以上述18个描述符作为输入,水溶解度作为输出,建立支持向量机预测模型,得到的结果为相关系数平方(r~2)是0.95,标准偏差(sd)为0.50。总之,我们对上述化合物的定量和定性研究,对于未知化合物相应性质的分类和预测,更进一步地对于药物的筛选或者新药的合成都具有重要的参考价值。本文用支持向量机这种重要的建模方法建立了以上模型,对支持向量机更广泛的应用于化学化工领域提供了借鉴和参考。