基于机器学习和不平衡数据采样技术的CYP450抑制剂预测研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:bai1988ping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细胞色素P450(CYP450)是药物代谢过程中具有关键作用的酶,化合物对CYP450的抑制作用可能会引起药物-药物相互作用,进而产生药物不良反应。因此,构建可以在药物设计早期阶段准确预测化合物对CYP450抑制作用的计算机模型具有重要价值。本研究从PubChem Bio Assay数据库中提取了17,000多种化合物对五种常见CYP450亚型(CYP1A2、CYP2C9、CYP2C19、CYP2D6、CYP3A4)的抑制活性数据,根据活性将这些化合物划分为抑制剂和非抑制剂,获得了五个CYP450亚型的抑制剂数据集。基于这些数据集,采用9种分子指纹提取了分子的特征,然后采用随机森林(RF)、支持向量机(SVM)、极限梯度提升(XGBoost)算法构建了针对五种CYP450亚型抑制剂的分类预测模型,但模型性能受到数据集中阴性化合物与阳性化合物数量不平衡的影响,预测性能不佳。为了进一步提升模型的性能,本研究使用了编辑最近邻法(ENN)、少类样本合成过采样法(SMOTE)和Tomek links方法进行了不平衡数据处理,使用同样的建模方法再次构建模型,最终我们得到了性能更加出色的预测模型。模型的预测性能由100次重复的五折交叉验证方法和外部验证方法评估。在五折交叉验证中,五种CYP450亚型抑制剂分类模型的ROC曲线下的面积(AUC)可以达到0.961-0.998,准确性(ACC)达到89.5%-98.5%;在外部验证中,AUC值可以达到0.664-0.975,ACC值达到76.7%-94.3%。经过平衡处理后的模型敏感性(SEN)达到了91.5%-98.0%,特异性(SPE)达到了87.1%-98.1%,均在较高的水平上达到了平衡。本研究使用了三种方法来处理不平衡的数据集,经过处理后建立的模型性能显著优于处理前的模型,且模型没有发生明显的过拟合。这种不平衡数据的处理方法在已有的CYP450抑制剂相关研究中尚未被使用。为了探究CYP450抑制剂的结构共性,通过随机森林模型确定了几个对模型预测性能有显著影响的结构片段,这些结构极有可能会与化合物的CYP450抑制能力相关,也为药物设计等相关研究提供了更有价值的参考。
其他文献
燕麦(Avena sativa L.)是优良的粮饲兼用作物,具有适应性强,适口性好,高产等优点,在世界各国广泛栽培种植,在我国具有较高的营养价值、饲用价值、经济价值。本试验以裸燕麦(白燕2号)和皮燕麦(白燕7号)两燕麦品种为试验材料,采用随机区组试验设计,设置三种施氮量分别为90 kg/hm~2(N90)、180kg/hm~2(N180)、270 kg/hm~2(N270),每种施氮量下设置三种基
学位
<正>自2018年NEJM发表的腹腔镜手术治疗子宫颈癌前瞻性临床试验(LACC)结果,以及2021年发在Am J Obster Gynecol上的腹腔镜手术治疗子宫内膜癌的多中心回顾性研究后,有关以腹腔镜和机器人为代表的腹腔镜手术在妇科恶性肿瘤手术中的应用相继受到质疑。然而,尽管研究结果显示腹腔镜手术治疗子宫颈癌和子宫内膜癌存在不良预后,但并未明确导致不良预后的原因,而这些手术的共同特点是都使用了
期刊
中小企业在我国经济运行中发挥着不可替代的作用,推动着国家经济的高速发展,但由于自身规模资质的限制,在传统信贷模式下很难获得融资支持。随着我国不断深化对外开放,全球经济融为一体,企业之间供应链管理趋向成熟,在这样的背景下供应链金融业务开始蓬勃发展,以全新的视角审查中小企业的融资风险,审查对象由单个主体转变为利益相关群体,不再受限于资质要求。供应链金融在支持中小企业的发展上又迈进一大步,填补了传统信贷
学位
屋面作为建筑围护结构重要组成部分,受太阳照射时间最长,所接受太阳辐射最大,在夏季需要采取遮阳隔热措施以减少屋面向室内传热。在世界能源日益短缺的今天,可再生能源的利用已经成为重中之重,其中以太阳能利用的研究工作最多。光伏遮阳屋面是近些年来兴起的一种新型遮阳隔热屋面,它是将光伏太阳能电池板布置于屋面上既起到阻挡太阳直接照射的作用,又起到光伏发电作用。由于光伏组件在工作时温度会升高,对光电转换效率有影响
学位
目的:通过运用单纯西药、中西药联合、针药联合几种疗法治疗气虚血瘀,痰浊阻络证胸痹心痛病患者,观察不同治法的疗效,比较几种疗法之间疗效的差异性。方法:本研究入组108例冠心病稳定性心绞痛患者,心绞痛分级为Ⅰ、Ⅱ级,且中医辨证分型为气虚血瘀,痰浊阻络证,将患者随机分为三组,每组各36例,对照组采用西药规范化治疗,试验1组采用西药规范化治疗+中药参红通络胶囊(长春中医药大学附属医院院内制剂),试验2组采
学位
热致相分离法基于高温溶解,低温分相的原理,具有操作简便,过程易于调控等优点,因此被广泛应用于聚合物多孔膜的制备。在该制膜方法中,铸膜液并不与外界发生直接的物质交换,而是发生热量传递过程并且在传热的过程中完成相分离致孔。调控聚合物多孔膜孔道结构以及扩展其应用一直是近些年该领域的研究热点。在第一部分中,首先利用聚偏氟乙烯/二甲基砜液-固相分离体系通过双向冷冻法成功制备得到聚偏氟乙烯直通孔膜。同时为双向
学位
异噻菌胺(3,4-二氯-N-(2-氰基苯基)-5-异噻唑甲酰胺)是第一个使用量低、对环境友好且有诱导抗性的杀菌剂,主要用于水稻稻瘟病的防治。然而,异噻菌胺的生产工艺存在低收率和纯度不高等方面的问题,为此,本论文系统总结了异噻唑类化合物的合成路径,并对异噻菌胺产品及其中间体衍生物的合成工艺进行系统地总结探讨改进,并就异噻唑类及其中间体衍生物的合成优化与结构分析进行首次报道。本论文通过研究原料的纯化、
学位
<正>引言近年来,互联网的发展推动电商行业规模不断扩大,与此同时快递物流行业异常繁忙。在物流产业迅猛发展的进程中,随之而来的火灾风险日益突出,物流货物仓储中频频发生火灾事故。那么如何协调当下消防安全中存在的问题,如何保证物流货物仓储的消防安全,急需我们加以关注。
期刊
近年来金属-有机功能配合物在催化、光学器件和芳香异构体的识别等方面具有广泛的应用,而引起了科研工作者的兴趣。8-羟基喹啉类衍生物与不同金属都具有很强的螯合作用,进而形成结构新颖、性能优异的金属-有机功能配合物。因此本文以8-羟基喹啉为基本骨架,设计合成了三种双8-羟基喹啉类有机配体。基于配位化学和超分子化学原理,制备了十二种结构新颖和功能独特的金属-有机功能配合物。通过红外光谱(IR)、X-射线单
学位
8-羟基喹啉功能材料在有机电致发光器件和光学传感等方面存在潜在的应用价值,近年来引起了科研工作者们广泛的科研兴趣。本文以8-羟基喹啉为基本骨架,通过修饰不同的功能基团,设计合成了两种8-羟基喹啉功能配体。利用分子设计和分子工程思想进行自组装,成功制备了一系列结构新颖、功能特异的8-羟基喹啉晶态材料。利用X-射线单晶衍射、红外、核磁共振氢谱等多种手段分析了它们的结构,并研究了它们的性能。主要工作如下
学位