论文部分内容阅读
量子化学方法是一种非常重要并且有用的理论方法,我们可以通过求解薛定谔方程来计算化合物的各种性质,对反应机理进行研究,但量子化学方法的应用受到研究体系和机器状况的限制。定量结构-活性/性质关系是另一种非常有用的研究手段,它有计算速度快,对机器要求低等优点,但是该方法的计算精度却不是很令人满意。因此,我们将这两种方法的优点相结合,衍生出一种基于量化计算的校正模型,它不仅具有高计算精度,还具有QSAR/QSPR方法快速的优点,具有很好的应用前景。本论文具体分为四章:第一章简单的阐述了量子化学理论、定量结构-活性/性质关系和基于量化计算的校正方法的基本原理和实现方法。第二章利用多元线性回归和局部建模,对密度泛函(DFT)法计算的927个化合物的生成焓数据进行校正,得到较好的结果。其中经过多元线性回归校正的DFT计算的生成焓的均方根误差(RMSE)数值由原来的126.6kJ/mol降为17.9kJ/mol,而用局部建模进行校正后的RMSE由126.6kJ/mol降为16.1kJ/mol。说明用局部建模法对生成焓的校正起到很好的效果,可以推广应用到其它热力学性质的计算。第三章将量子化学计算与统计校正方法结合,建立了预测148个含氯化合物的碳氯单键BDE的计算方法。该方法是在用一种量子化学计算方法-密度泛函法中的B3LYP法用6-311+G(d,p)基组对这些含氯化合物的碳氯单键的BDE进行计算,然后用遗传算法选出对碳氯单键BDE影响最大的6个描述符,建立校正模型,结果说明该方法在很大程度上改善了BDE的计算结果。未进行校正之前最大的偏差为15.5kcal/mol, RMSE为6.13kcal/mol,多元线性回归模型校正后的最大偏差为12.04kcal/mol, RMSE为2.66kcal/mol, LS-SVM模型校正后最大偏差变为9.93kcal/mol, RMSE降为2.47kcal/mol。说明LS-SVM校正的BDE的DFT计算数值得到很大提高,这种方法可以用于其它类型BDE的计算。第四章是用量子化学计算了159个有机化合物的电离能,用遗传算法选出与离子化能相关最高的8个描述符,并用它们分别建立线性(GA-MLR)和非线性模型(LS-SVM),最终的计算结果表明用多元线性回归校正的离子化能的RMSE由原来DFT计算的0.52eV降为0.42eV,而采用LS-SVM模型校正后的RMSE降为0.29eV,数据的准确性有了大幅度的提高。说明LS-SVM对离子化的能校正有着显著的效果,可以推广应用到其他类型有机化合物的电离能的预测。