基于机器学习方法预测药物代谢稳定性的研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:ii688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物代谢的稳定性作为一个药物的关键性质,是极其重要的,决定了药物药代动力学的主要性质。因此为了降低在临床阶段由于候选药物的代谢不稳定或稳定而带来高成本的风险,建立一套有效的和可靠的方法in silico预测药in vitro的代谢稳定性和in vivo的药代动力学相关参数,具有重要的实际意义。而随着大量的体外、体内实验分析的数据累积,以及相关数据库的构建及高质量的数据整理,目前建立in silico的预测模型的条件已经具备。特别是应用机器学习相关技术,由于其在处理多样性结构下及复杂问题中的优秀表现,特别适用于药物的代谢稳定性和药代动力学指标的分类和预测。然而,基于机器学习方法在体外、体内代谢稳定性的预测仍然有很多急需要解决的问题。通常这些模型的内部验证很好,外部预测效果不理想,即模型的泛化能力很差。主要的原因是两方面:第一,没有抓住关键的特征,而采用了过多的特征导致模型太过复杂,存在可能的过拟合而导致模型扩展能力变差;第二,由于有限的训练样本数目导致训练集缺乏代表性。因此,在本论文的第一次研究中,我通过使用新的特征选取方法,构建了预测化合物体外血浆稳定性的支持向量回归(SVR)模型。在特征的选取中,发现合理恰当的选取描述符以及描述符的个数,可以大大提高模型的外部预测性能,同时借助核主成分分析(KPCA)方法显示不同描述符组合下在高维空间的线性可分情况,进一步说明了特征选取的重要性。这可能会为其他模型的建立提供帮助。最后建立的人血浆体外稳定性模型可以为in silico体外预测提供便利的帮助,同时筛选出与稳定性非线性相关的重要描述符和分子指纹,为前药和软药的设计提供思路。在本文的第二次实证研究中,选取了in vivo的药代动力学参数——药物的半衰期作为研究对象。首先为了扩大训练集样本数目和结构的多样性,通过广泛的数据搜集,获得了据我所知最大数据集的药物半衰期数据。之后分析了哪些分子描述符和外部因素对半衰期有较大的影响,其次使用经典的机器学习方法朴素贝叶斯分类器和递归分割来建立预测模型识别药物半衰期的长短,同时探究了不同分子指纹和描述符组合下的预测性能,最后建立的贝叶斯推断模型具有一定的识别能力。这些模型与方法为设计合成以及在临床实验前确定药物的半衰期有重要参考价值。
其他文献
文化产业是传承创新文化的重要途径,是彰显城市文化价值和经济价值的重要载体。洛阳的观赏石文化历史悠久、底蕴深厚,为观赏石文化产业的发展奠定了坚实的基础。但洛阳观赏石
工程项目费用风险分析与管理是现代工程项目风险管理的重要组成部分 ,本文通过具体的实例具体介绍了运用概率与数学模拟的方法分析出工程项目费用风险因素 ,并提出相应的工程
目的总结综合ICU中建立人工气道患者的护理体会。方法依据护理方式的不同将2015年1月—2017年1月于我院综合ICU中建立人工气道患者60例分为2组,对照组用常规护理方式干预,观
<正> 一、青年爱情观的变化爱情是人类的一种高级的精神生活,是异性间以互相倾慕并渴望对方成为自己终生伴侣的一种深沉的感情。因此,爱情不仅表现在恋爱中,而且表现在婚姻和
在己内酰胺直型聚合管设计中采用了 V型挡板 ,经模拟试验和实际应用 ,效果均十分明显。采用 V型挡板改善聚己内酰胺熔体的径向混合效果 ,有效地减少己内酰胺熔体的径向温差 ,
[目的]探讨半夏鸟苷、总生物碱含量的变化规律,为确定半夏采收期提供科学依据。[方法]采用HPLC法和酸性染料比色法,分别测定不同采收期半夏块茎中鸟苷和总生物碱的含量。[结
本研究的目的就是从鹿胎盘中提取出鹿胎盘生物活性肽,并测定其理化性质和免疫活性,看其与人胎盘肽的活性是否一致,从而可为鹿胎盘肽的深入研究,以及今后将鹿胎盘肽用于治疗人
<正> 法国十九世纪批判现实主义作家小仲马,在他的著名小说《茶花女》中,以深厚的人道主义同情,细腻的手笔,描绘了一个妓女的生活与爱情,展示了她的复杂、矛盾的思想感情,表
4,4'-二氨基二苯甲烷和马来酸酐在丙酮溶剂中反应,然后用乙酸酐作脱水剂,在三乙烯二胺催化作用下脱水,得到混合物双马来酰亚胺(M—BMI),其熔点在60~80℃之间。将M—BMI加到环氧/酸酐体
分析了己内酰胺聚合萃取水回收与聚合 4种工艺路线 ,其中己内酰胺的开环与成环反应为萃取水回收开辟了新的方法。提出建设大型己内酰胺聚合装置对萃取水回收 ,应选择浓缩液直