论文部分内容阅读
定量构效关系QSAR(quantitative structure-activity relationships),作为一个方面的应用,因其能对已经进入人类中的生物毒物以及尚未投放市场的新化合物的毒性进行成功的预测和评价,近年来越来越受到人们的重视。该研究中,其关键步骤是分子结构特征的提取,即分子结构描述符的确定。通常有多种方法可供选择。如常见的有基于分子拓扑矩阵计算拓扑指数类参数的提取分子结构特征方法,基于量子化学计算的提取分子结构特征的方法等。本文不使用业已广泛应用的拓扑指数类结构参数和量子化学类参数,另辟研究途径,综合运用包括选取文献上常见的基团电负性效应参数σx、极化效应参数σα、场效应参数σF、及共轭效应参数σR电子效应类型参数及基团立体效应参数L、疏水参数π等取代基结构参数作为分子结构描述符,直接作为化合物的结构表征,进行苯胺类、硝基苯类及苯酚类化合物生物毒性的QSAR研究,取得了较满意的结果。 本研究主要内容包括:⑴根据苯胺类、硝基苯类和苯酚类化合物结构特点和对生物毒性的影响,运用多种变量筛选法,筛选出不同位置上的取代基结构参数及分子指示变量 I等,作为各种见建模的特征变量。⑵建立了预测苯胺类、硝基苯类和苯酚类化合物生物毒性的多元线性回归模型。模型均通过了严格的内部统计学检验和独立检测集检验,具有稳定和预测结果好的特点,总体上模型精度与目前文献上的类似工作相当。⑶建立了预测苯胺类、硝基苯类和苯酚类化合物生物毒性的偏最小二乘回归模型。经模型内外部检验,各模型具有稳健性,模型的精度好于同类普通回归模型。⑷建立了预测苯胺类、硝基苯类和苯酚类化合物生物毒性的BP-人工神经网络模型。根据人工神经网络基本理论和有关经验公式,优化了网络结构,模型经实际运行检验,具有良好的泛化性,预测精度明显好于普通回归模型和偏最小二乘回归模型。⑸所建的模型可用于苯胺类、硝基苯类和苯酚类化合物结构与生物毒性关系的理论解释:对于苯胺类和硝基苯类化合物,其中场效应参数σF和分子指示变量I是影响生物毒性的关键因素;对于苯酚类化合物,邻位的基团立体效应参数L1是影响苯酚类化合物生物毒性的关键因素;取代基结构对生物毒性影响可以分析理解如下:苯胺类、硝基苯类及苯酚类化合物的有机毒性与取代基的种类和其在苯环上的位置及数目有关,正是这些结构参数对应电子效应的综合影响,才产生了大小不同的生物毒性;推测苯胺类、硝基苯类化合物分别对小鼠和黑呆头鱼的毒性应该以反应性致毒机理为主,而接触性致毒机理可能是次要的。⑹由本文较为系统的研究工作可以得出,以取代基结构参数作为分子结构描述符,进行QSAR/QSPR研究是可行的。显然,这种直接提取化合物结构表征的方法,不仅省去了分子结构特征的繁复计算,而且由于这些电子效应类型等结构参数数据丰富,将有助于利用计算机自动提取化合物的结构表征,从而为定量结构活性相关研究的智能化创造了条件。