论文部分内容阅读
定量结构一性质相关(Quantitative Structure-Property Relationships QSPR)和定量结构一活性相关(Quantitative Structure-Activity Relationships QSAR)的研究已成为化学和环境科学研究中的一个前沿领域。定量构效关系(QSPR/QSAR)是借助化合物的分子结构参数和数学模型描述化合物的结构与其物理化学性质或生物活性之间的定量关系。通过这些数学模型,我们可以预测一些未知化合物的物理化学性质和生物活性等。本论文从分子结构的定量描述和结构性质定量关系建立的基本理论入手,研究了QSAR/QSPR方法在化学和环境科学方面的应用。同时,着重论述了径向基函数神经网络(Radial Basis Function Neural Networks,RBFNNs)方法建立的QSAR/QSPR模型,并对所建立的模型做了分析评价。本论文第一章介绍了定量构效关系的概念、基本原理、方法以及研究状况。同时,详细介绍了RBFNN算法、SVM算法和模型评价的基本原理及近年来的一些重要应用。本论文第二章具体介绍了利用HM方法、RBFNN方法和SVM方法在化学和环境科学中的应用。简单介绍如下:1.应用QSAR方法研究了92个取代苯类化合物对鱼的毒性。运用HM方法和RBFNN方法分别建立了这些取代苯类化合物的结构与毒性关系之间的线性和非线性模型。这两种方法对测试集的相关系数的平方(R~2)分别为0.867和0.876,相应的均方根误差(RMSE)为0.223和0.205。通过对所建模型的预测能力评估和与其它文献结果的比较,可以看出,我们的RBFNN模型有较好的预测能力。对所选描述符进行了详细合理的解释,有利于发现毒性机理,能够为环境评估做出新的贡献。2.QSPR方法用于预测42个向热型液晶的向列转变温度(T_N)。HM方法、RBFNN算法和SVM方法分别被用来构建这个数据集三种预测模型。基于径向基函数神经网络(RBFNN)方法所建立的这个最优的QSPR模型给出的结果如下:对于训练集的平方相关系数(R~2)是0.984,对于测试集的平方相关系数(R~2)是0.953,对于整个数据集的平方相关系数(R~2)是0.973;对于训练集的均方根误差(RMSE)是2.19,对于测试集的均方根误差(RMSE)是4.13,对于整个数据集的均方根误差(RMSE)是2.99。通过对整个数据集的多样性分析和所建模型的预测能力评估及与其它文献结果的比较,可以看出,我们的RBFNN模型有很好的预测能力。对所选描述符进行合理的解释,有利于理解影响向热型液晶的向列转变温度的因素。3.应用HM方法和RBFNN方法分别建立了60℃时,90个转变试剂对于苯乙烯聚合反应的动力学链转变常数的定量结构-活性关系模型,并探讨了影响苯乙烯的自由基聚合链转变常数的结构因素。通过所建模型的预测能力评估和预测模型应用领域的讨论及预测结果比较表明,RBFNN方法模型性能要优于HM方法模型。讨论表明,氢键和电荷是和60℃时苯乙烯的自由基聚合链转变常数紧密相关的结构因素。RBFNN模型简单快捷,能准确的描述结构参数和反应性之间的关系。