论文部分内容阅读
在化学计量学的研究中,常需要通过建立相关的数学模型来分析物质。因此,诞生了多种分析化学的建模方法。然而,传统的单模型建模方法对数据中的噪声和样本量都比较敏感,在分析复杂的化学测量数据时,容易受到数据中噪声或样本量的影响,使模型的普适性大大降低。为了弥补单模型建模方法的不足,近年来,集成建模方法受到普遍重视,在很多研究领域得到广泛的研究和应用。本论文以烃类物质的物理化学性质作为研究对象,对集成建模在3D-QSAR和HQSAR两种建模方法中的应用进行了探究。主要内容包括:第一章综述了3D-QSAR、HQSAR、集成建模的基本原理,重点对集成建模的基本理论,建模方法进行了介绍。第二章以烃类物质的折光率作为研究对象,用3D-QSAR和HQSAR两种方法建立模型,并使用留一交叉验证和外部测试集验证的方法评估了这两种方法的预测性能和稳健性。结果显示,3D-QSAR中的Co MSIA方法所构建的模型并不具备预测烃类物质折光率的能力;Co MFA和HQSAR两种方法所建模型都可用于预测烃类物质的折光率,但是HQSAR模型优于Co MFA模型。第三章主要是将集成建模方法加入到3D-QSAR方法之中,以烃类物质的折光率为研究对象,在原有训练集的基础上,划分验证集,通过bagging方法对训练集内样本进行扰动,再使用3D-QSAR方法建立多个集成建模的成员模型,根据模型的筛选标准选取预测能力较好的模型,最终通过共识原则结合得到我们3D-QSAR集成建模的结果。通过与第二章传统3D-QSAR建模方法建模结果的对比,集成建模方法的确有助于提高3D-QSAR建模的预测能力。第四章主要是将集成建模方法加入到HQSAR方法之中,同样以烃类物质的折光率作为研究对象。集成建模步骤与第三章大致相同,区别在于使用HQSAR方法建立成员模型。最终所得的集成建模预测结果,与第二章传统HQSAR建模方法建模结果的对比,集成建模方法同样也提高HQSAR建模的预测能力。第五章以烃类物质的沸点作为研究对象,用3D-QSAR和HQSAR两种方法建立模型并且分析预测结果,并使用留一交叉验证和外部测试集验证的方法评估了这两种方法的预测性能和稳健性。结果表明,Co MFA和HQSAR两种方法所建模型都可用于预测烃类物质的沸点,但是HQSAR模型优于Co MFA模型。第六章主要是将集成建模方法加入3D-QSAR中对烃类物质沸点数据进行研究,再把结果与第五章传统3D-QSAR进行对比,在对烃类物质沸点的研究中,集成建模方法的加入,依旧提高了3D-QSAR模型的预测能力。第七章主要是将集成建模方法加入HQSAR中对烃类物质沸点数据进行研究,再把结果与第五章传统HQSAR进行对比,在对烃类物质沸点的研究中发现,集成建模方法的加入虽提高了HQSAR模型的预测能力,但是提升幅度不大。