论文部分内容阅读
有机化合物定量结构活性/性质关系(QSAR)的研究对于有机污染物的生态风险预测与评价、污染控制和防御等具有十分重要的意义。本论文所研究的有机污染物是一类带有苯环结构的芳香类化合物,广泛存在于石油化工、染料、农药和制药等工业排放中,许多芳香化合物(如氯酚、硝基苯、苯胺等)为美国EPA优先控制污染物。在QSAR研究中,分子连接性指数(MCI)和量子化学参数计算是获得分子结构参数的重要手段。对于具有苯环结构的有机化合物,分子连接性指数可通过杂原子点价以及各阶指数的值不同,从而确定取代基的个数、取代基的类型,以及取代基的位置。量子化学参数具有明确的物理化学意义,能够描述分子微观的电子构型和空间形态方面的性质,包括形态、价键特征、电子活性、分子的各个层次级别的结构等。据文献报道,结合这两类参数研究有机污染物的活性胜质可建立更优化的QSAR模型。本论文结合这两类变量参数建立了芳香类有机污染物活性/结构的QSAR模型。线性回归分析是一种的传统QSAR研究方法,主要用于所建立的QSAR模型参数筛选。在本论文第三、四、五章的具体案例研究中,利用线性回归分析对建立模型的参数筛选进行了重点讨论。此外,论文还采用BP网络、RBF网络、支持向量机方法对化合物的活性/性质建立相关的QSAR模型,并筛选最优QSAR模型,可用于预测同类有机化合物的活性/性质。本论文的第一章主要对定量构效关系的发展历程、研究现状进行了概述,并阐述了本论文的研究目的和意义。论文第二章对QSAR研究中的结构参数和建模方法进行了概括总结。在结构参数方面,重点描述了分子连接性指数和量子化学参数的理论定义、计算方法、各描述符和特点。在建模方法中,全面的介绍了各种线性回归的方法和原理。并对神经网络和支持向量机方法的原理与应用也进行了陈述。论文第三章介绍了芳香类有机污染物Kow和BCF的QSAR研究。首先,筛选分子连接性指数、量子化学参数以及非色散力因子△X等变量参数,对44种芳香类有机污染物的辛醇/水分配系数(Kow)和生物富集因子(BCF)进行逐步线性回归分析,从而建立最优QSAR模型,相关系数r2分别为0.926、0.914。利用线性回归分析中筛选的参数,建立BP网络和RBF网络模型。其中BP网络建立的模型同样具有较好的预测能力,相关系数r2分别达到为0.925、0.912。论文第四章是关于利用分子连接性指数预测芳香类有机污染物Koc的研究。首先计算了61种芳香类化合物的分子连接性指数,并采用逐步线性回归方法建立了芳香类化合物土壤吸附系数(Koc)与分子连接性指数的QSAR模型。方程选入1Xv、4Xvpc连接性指数,得到有效的QSAR模型,相关系数r2=0.963。应用支持向量机所建立的Koc模型也有一定的预测能力(r2=0.941),但其效果不如线性回归建立的模型强。论文第五章利用量化参数结合MCI研究了芳香类有机污染物对水生发光菌的毒性。计算了37种芳香类化合物的量子化学描述符,结合分子连接性指数1Xv,应用逐步线性回归分析筛选参数,建立了芳香类化合物对水生发光菌毒性的QSAR模型,建立的模型相关系数r2为0.933。此外,还采用BP网络和支持向量机方法建立了该毒性模型,结果显示,BP网络和支持向量机方法均能建立芳香类化合物对水生发光菌毒性的预测模型。得到的相关系数r2分别为0.925,0.937。第六章对本论文的研究内容、创新点以及不足之处进行了总结,并在此基础上,对今后该方面可进一步开展的具体研究内容和方向提出了可行性建议。本论文结合分子连接性指数、量子化学参数,采用BP网络方法、RBF网络方去和支持向量机方法建立了部分芳香类有机污染物的理化性质参数:Kow、BCF、Koc及对水生发光菌毒性的QSAR模型,并采用逐步线性回归分析对模型进行优化,在前人研究的基础上获得一些成果。所建立的模型对芳香类有机污染物活性/结构的预测具有一定的参考价值。