论文部分内容阅读
研究收集美国国立健康研究所化学基因组中心利用高通量筛选测定的1万多种化合物对5种细胞色素P450(CYP450)酶的抑制数据,利用随机森林法构建MOE2D描述符的分类模型.采用五折交叉验证建模策略保证模型的预测能力.模型对1A2、2C9、2C19、2D6和3A4等酶抑制剂预测的正确分类率分别高达84.4%、82.5%、82.1%、78.4%和80.0%,结构分析表明,卤代(氯/氟)芳烃结构在抑制剂中出现概率显著高于非抑制剂.最后,利用上述模型对ToxCast项目954个化合物进行虚拟筛选.实例化合物分析验