论文部分内容阅读
本论文主要介绍分子模拟量化计算在有机合成反应机理推导以及在QSAR(Quantitative Structure Activity Relationships)两个方面的应用。 首先,分子模拟推导有机合成反应机理时,本论文研究的对象是L-2-巯基组氨酸的合成机理,研究的工具是HyperChem8.0量化计算软件。该部分分为实际操作和模拟推导反应机理两部分。在合成L-2-巯基组氨酸时以L-组氨酸甲酯二盐酸盐为原料,以水和四氢呋喃为溶剂与苯甲酰氯反应得到2,4,5-三苯酰基-4-烯戊酸甲酯,并以其为原料在10%的HCl甲醇溶液中回流得到2,5-二苯酰基-4-酮戊酸甲酯,再以其为原料在20%的HCl溶液中回流得到4-氧代鸟氨酸继续与硫氰酸钾反应得到L-2-巯基组氨酸,在合成时对每一步进行结构表征;在模拟推导反应机理时以L-组氨酸为原料,模拟计算L-组氨酸分子的前沿轨道能、静电势、原子电荷确定化学反应活性中心并结合化学反应机理有关文献,得到多种可能产生的中间产物及相应的总能量(TE),并对可能形成的中间体进行键能、前沿轨道对称性分析,得到最有可能的中间产物,直至推导出整个反应过程的机理。 其次,分子模拟在QSAR中的应用,主要是运用HyperChem8.0软件对研究对象进行结构参数描述符进行AM1半经验模拟计算,并以其相关活性为因变量,17种化学结构参数值为自变量进行QSAR研究。分别通过PASW Statistics18.0软件在置信度为95%时,进行逐步多元线性回归分析,筛选出对活性影响最大的结构描述符,并根据R2>0.6,VIF(Variance inflation factor)在1.0~5.0之间选择合适的模型。按照交叉系数q2>0.5原则,进行LOO(Leave one out)法计算出预测值,检验模型的稳定性和预测能力,并观察预测值和文献值的线性关系以及利用多层感应器神经网络方法选择合适的输入层、隐藏层以及输出层,找出准确度最高的模型(一般只要模型的准确度≥0.6即可认为有效)进行QSAR研究,并对两种QSAR模型的预测结果进行比较。本论文对3类化合物进行了QSAR研究:巴比妥酸类衍生物、苯砜基羧酸酯类化合物、硝基苯和卤代苯酚化合物。 利用化合物的结构与色谱容量因子k之间的构效关系预测巴比妥酸脱酸类衍生外推至纯水时的色谱容量因k。首先进行多元线性回归研究,在R2>0.6, VIF值在1.0~5.0之间的原则选择合适的模型:lgk0=-0.017 HE-0.018 HF+0.200P-2.198。得到的预测值和文献值进行线性研究并发现其线性方程:lgk0=1.0941lgk0-0.2238,R2=0.82说明该模型对巴比妥酸类衍生物的lgk值有很好的预测能力。其次通过ANN分析,随机选择几个化合物作为测试集,其余作为训练集,建立BP-ANN模型,输入层、隐藏层、输出层的节点分别为10,6,6,1模型准确度为0.668,训练集的预测值与文献值的线性关系系数为0.872,测试集的预测值与文献值的线性关系为0.843。 利用化合物的结构和活性之间的构效关系预测苯砜基羧酸酯类化合物的活性。首先进行多元线性回归研究,在R2>0.6,VIF值在1.0~5.0之间的原则选择合适的模型:-lgIC50=1.168*10-5 IAE-0.002 SA+3.651。得到的预测值和文献值之间进行线性研究发现其线性:-lgIC50=0.766(-lgIC50)+0.447,R2=0.72,同时将苯砜基羧酸酯类化合物进行分类,通过留几法建立模型方程:-lgIC50=2.556*10-5 IAE+0.004HE+3.450,预测得到的预测值与文献值之间线形关系方程:-lgIC50=1.956*(-lgIC50)-1.3222,R2=0.71结果更加证明该模型对苯砜基羧酸酯类化合物的活性能够很好的预测。其次通过ANN分析,随机选择几个化合物作为测试集,其余作为训练集,建立BP-ANN模型,输入层、隐藏层、输出层的节点分别为10,7,3,1模型准确度为0.948,训练集的预测值与文献值的线性关系系数为0.922,测试集的预测值与文献值的线性关系为0.882。 利用化合物的结构与毒性之间的构效关系预测硝基苯和卤代苯酚类化合物的活性。首先进行多元线性回归研究,在R2>0.6,VIF值在1.0~5.0之间的原则选择合适的模型:-lgIC50=0.006 SA-0.001 BE+0.020 R-3.467。得到的预测值和文献值之间进行线性研究发现其线性:-lgIC50=1.0039*(-lgIC50)+0.0395,R=0.804。说明该模型对85种硝基苯和卤代苯酚类化合物的活性有很好的预测能力。其次通过ANN分析,随机选择几个化合物作为测试集,其余作为训练集,建立BP-ANN模型,输入层、隐藏层、输出层的节点分别为10,5,4,1模型准确度为0.905,训练集的预测值与文献值的线性关系系数为0.91,测试集的预测值与文献值的线性关系为0.948。