论文部分内容阅读
定量结构性质关系(Quantitative structure-property relationship,QSPR)是一种通过在化合物理化性质与其结构特征之间建立数学联系,并借此预测未知化合物理化性质的研究方法。Murray等提出的分子表面静电势参数,广泛地应用于与溶质-溶剂相互作用有关的理化性质的QSPR研究中。本课题组发展了一系列新的表面静电势参数,使该类参数的可解释性大大增加,同时拓宽了其应用范围。然而,以往的研究对象都限定在中性化合物。本文将主要探索分子表面静电势参数在离子型化合物QSPR中的应用。
研究内容共分为三个部分。
第一部分为化合物皮肤渗透性的QSPR研究。首先,我们采用分子表面静电势参数与多元线性回归分析(MLR)对文献报道的241种化合物(包括29种离子型化合物)的皮肤渗透系数logKp进行建模,所得结果差强人意。随后将化合物分为中性分子和离子两种类型分别建模,结果也不是很理想。其后,采用分子拓扑指数作为描述符进行QSPR建模,部分模型显示出一定的拟合能力。其中,基于3D-MoRSE参数集构建的模型性能最佳,R2=0.544,SD=0.804,F=7.320。考虑到表面静电势参数和分子拓扑指数在描述分子间静电作用和立体作用上具有一定的互补性,我们最后将两类参数进行整合,在删除个别异常样本后,得到了具有较好预测能力的QSPR模型。在此基础上,我们进一步用支持向量机(SVM)、最小二乘支持向量机(LSSVM)以及高斯过程(GP)等非线性方法进行处理,得到了具有预测能力优良的GP模型,R2=0.967、RMSEE=0.222、Rcv2=0.593、RMSCV=0.781、Rpred2=0.809和RMSEP=0.480。对其进行蒙特卡洛交叉验证(MCCV)分析,其峰值、中位和积分qext2值分别是0.845、0.825、0.814,预示着模型具有较高的稳定性和较强的预测能力。
第二部分针对在人体内以离子形式存在的酸性药物的清除率开展QSPR研究。研究表明,采用单纯的表面静电势参数进行建模,无法得到合理的QSPR模型。将分子拓扑指数作为补充建模,得到的模型表现一般。结合文献调研,我们推测,药物在体内的清除过程中包括了药物转化成其它代谢产物,涉及到化学键的断裂,而表面静电势参数以及分子拓扑指数反映的信息都仅仅与分子间非共价作用相关,因而在描述药物的定量结构-清除关系方面还存在很大局限性。
最后一部分工作是离子型化合物的定量结构-保留关系(Quantitative structure-retention relationships,QSRR)研究。采用分子表面静电势参数结合MLR分析,我们对三组离子色谱参数(线性溶剂强度方程中的系数a和b)与分子结构进行了关联。所有模型都显示出较好的拟合能力。在此基础上,建立了非线性模型并对模型进行了严格的MCCV分析,结果显示大多数模型都表现出良好的预测能力和稳定性,其中GP模型最佳。这些结果不仅为离子色谱保留时间的预测提供了一种新的方法,同时也表明分子表面静电势参数在离子型化合物理化性质的预测方面有着较好的适用性。
研究内容共分为三个部分。
第一部分为化合物皮肤渗透性的QSPR研究。首先,我们采用分子表面静电势参数与多元线性回归分析(MLR)对文献报道的241种化合物(包括29种离子型化合物)的皮肤渗透系数logKp进行建模,所得结果差强人意。随后将化合物分为中性分子和离子两种类型分别建模,结果也不是很理想。其后,采用分子拓扑指数作为描述符进行QSPR建模,部分模型显示出一定的拟合能力。其中,基于3D-MoRSE参数集构建的模型性能最佳,R2=0.544,SD=0.804,F=7.320。考虑到表面静电势参数和分子拓扑指数在描述分子间静电作用和立体作用上具有一定的互补性,我们最后将两类参数进行整合,在删除个别异常样本后,得到了具有较好预测能力的QSPR模型。在此基础上,我们进一步用支持向量机(SVM)、最小二乘支持向量机(LSSVM)以及高斯过程(GP)等非线性方法进行处理,得到了具有预测能力优良的GP模型,R2=0.967、RMSEE=0.222、Rcv2=0.593、RMSCV=0.781、Rpred2=0.809和RMSEP=0.480。对其进行蒙特卡洛交叉验证(MCCV)分析,其峰值、中位和积分qext2值分别是0.845、0.825、0.814,预示着模型具有较高的稳定性和较强的预测能力。
第二部分针对在人体内以离子形式存在的酸性药物的清除率开展QSPR研究。研究表明,采用单纯的表面静电势参数进行建模,无法得到合理的QSPR模型。将分子拓扑指数作为补充建模,得到的模型表现一般。结合文献调研,我们推测,药物在体内的清除过程中包括了药物转化成其它代谢产物,涉及到化学键的断裂,而表面静电势参数以及分子拓扑指数反映的信息都仅仅与分子间非共价作用相关,因而在描述药物的定量结构-清除关系方面还存在很大局限性。
最后一部分工作是离子型化合物的定量结构-保留关系(Quantitative structure-retention relationships,QSRR)研究。采用分子表面静电势参数结合MLR分析,我们对三组离子色谱参数(线性溶剂强度方程中的系数a和b)与分子结构进行了关联。所有模型都显示出较好的拟合能力。在此基础上,建立了非线性模型并对模型进行了严格的MCCV分析,结果显示大多数模型都表现出良好的预测能力和稳定性,其中GP模型最佳。这些结果不仅为离子色谱保留时间的预测提供了一种新的方法,同时也表明分子表面静电势参数在离子型化合物理化性质的预测方面有着较好的适用性。