论文部分内容阅读
本文研究了人工神经网络(ANN)和支持向量学习机(SVM)技术对药物活性进行分类预测的应用,论文共分为三章:第一章作为引言,介绍了当前计算机辅助药物设计概况,优化药物设计的理论发展趋势及其我们所作工作的一些概要。第二章阐述了本文所用机器学习方法ANN和SVM的基本原理,表征药物分子结构和物理化学性质的分子描述符,及描述符变量的预处理和筛选方法,并就建模预测能力的评价方式进行了说明。第三章为本文研究的重点,我们将SVM和ANN这两种机器学习方法用于对选择性环氧化酶-2抑制剂活性建立活性预测模型进行研究。针对476个药物化合物分子的数据库,我们用Kennard-Stone方法将其分为训练集、测试集、验证集。计算了包含结构类和拓扑类的459个分子描述符,以表征化合物的结构和物理化学性质。为了去掉低信息量的描述符数量,首先对描述符作预处理:如果一个分子描述符的相对方差小于0.05或者训练集中含有相同描述符数值的分子的比例达到90%,或者与其他的分子描述符的相关系数达到0.90的,均要被删除。然后用F-Score方法对其重要性大小排序,通过优化模型最大推广能力筛选出最重要的136分子描述符,分别应用于SVM和ANN方法对选择性环氧化酶-2抑制剂活性模型的建立,并对两种方法所得到的结果进行了比较。对选择性环氧化酶-2抑制剂的预测能力建模,我们的研究结果表明,ANN和SVM方法所建模型,其预测能力均优于前人所作的工作。在未进行筛选和参数优化的情况下,ANN方法建模预测能力稍好;通过描述符的合理构建与优化,训练集的合理选用,SVM方法所建立的COX-2选择性抑制剂的预测模型,其预测能力是最好的,其中正样本的正确预测率SE由91.42%提高到94.28%;负样本正确预测率SP由84.00%提高到92.00%。