论文部分内容阅读
多环芳烃是一种对环境和人类健康危害较大的,具有致癌、致畸和致突变作用的大气有机污染物。随着对多环芳烃毒性效应的认识,国内外研究人员也将多环芳烃的致毒机制作为安全领域的重要课题进行研究。定量构效是目前国际上有机污染物毒性检测方面最为有效的方法之一。利用数学模型可直接从化合物分子结构获取其毒性值,避免了传统实验方法成本昂贵、过程复杂等弊端。因此开展多环芳烃毒性的定量构效预测,对多环芳烃的生态风险预测与评价,污染控制和防御有着十分重要的意义。本论文针对多环芳烃的毒性研究,主要开展了多环芳烃的致癌性和空气-正辛醇分配系数(KOA)的定量构效预测。针对多环芳烃样本数据不足、呈非线性的特点,提出了采用支持向量机算法建立构效模型。针对参数选择对支持向量机影响较大的问题,提出了采用网格搜索法、遗传算法和粒子群算法进行参数寻优。具体研究如下:1.对多环芳烃KOA回归的定量构效预测,首先对数据进行归一化预处理,采用回归支持向量机算法实现模型的建立。计算回归模型的拟合决定系数和均方误差,以人工神经网络算法的结果验证预测能力。其次,利用网格搜索法、遗传算法和粒子群算法优化模型。结果表明支持向量机在回归预测上拟合决定系数大于人工神经网络,均方误差小于人工神经网络。网格搜索和粒子群算法优化的模型预测效果优于原模型,遗传算法优化中出现过拟合现象,预测效果不佳。综合分析表明网格搜索法优化的回归构效模型预测效果最佳。2.对多环芳烃致癌性分类的定量构效预测,首先对数据采用主成分分析方法进行降维处理,采用分类支持向量机算法实现模型的建立。计算分类模型的分类准确率,并通过人工神经网络算法的结果验证预测能力。其次,利用网格搜索法、遗传算法和粒子群算法分别进行参数选择,用最佳参数组合建立模型。结果表明支持向量机在分类预测上分类准确率大于人工神经网络。网格搜索、遗传算法和粒子群算法优化的模型预测效果都优于原模型。综合分析表明遗传法优化的分类构效模型预测效果最佳。