【摘 要】
:
近年来,深度学习技术由于其强大的学习能力已经被广泛地应用到了分子属性预测以及分子生成领域。基于深度学习的分子属性预测方法通过自动学习样本特征,能够对大量化合物进行快速预测。而深度分子生成方法则可以高效探索大型化学空间,生成大量具有所需特性且结构多样的新型分子。然而整体而言,深度学习技术在分子属性预测以及分子生成领域的应用仍处于初步阶段,许多问题都有待进一步解决。在基于深度学习的分子属性预测方法中,
论文部分内容阅读
近年来,深度学习技术由于其强大的学习能力已经被广泛地应用到了分子属性预测以及分子生成领域。基于深度学习的分子属性预测方法通过自动学习样本特征,能够对大量化合物进行快速预测。而深度分子生成方法则可以高效探索大型化学空间,生成大量具有所需特性且结构多样的新型分子。然而整体而言,深度学习技术在分子属性预测以及分子生成领域的应用仍处于初步阶段,许多问题都有待进一步解决。在基于深度学习的分子属性预测方法中,大多数模型都是黑箱子,我们无法得知模型预测的机制和原理。并且该领域仍然缺乏用于构建和测试预测模型的高质量数据以及充分评估模型预测正确性的置信度估计方法。而深度分子生成方法中也存在许多问题,如评估深度生成模型或生成分子质量的可靠指标和基准不够全面、生成的分子合成难度相对较大、针对具体靶点的应用研究较为稀少等等。本研究工作主要从分子属性预测方法的可解释性以及结合分子动力学模拟和不同深度分子生成模型进行GLP-1R小分子激动剂的发现两方面进行展开:1.基于深度学习的分子属性预测新方法的研究和探索。本工作提出了一种新型的图神经网络模型—Iteratively-Focused Graph Network(IGN),该模型使用多步focus机制对节点权重不断调整更新,最终通过识别分子中关键节点对分子性质进行预测。本工作使用Molecule Net中的8个数据集对模型进行训练、验证和测试。最终可视化结果表明,模型可以逐步识别分子中与属性相关的关键节点,从而对模型的预测进行解释。同时,分子中关键节点的可视化也可以为分子的进一步优化提供一定程度的指导。本工作也从回归任务和分类任务两方面证明了IGN模型性能的优越性,如在基于毒性的TOX21数据集中,IGN模型的AUC值比DMPNN模型高出0.024,在Freesolv数据集中IGN模型的MSE值比Attentive FP模型降低了0.718。我们也通过消融研究验证了本工作提出的多步focus机制对提升模型性能的必要性。此外,我们还针对该模型创建了相关网站(http://graphadmet.cn/works/IGN),以便药物研究人员使用。2.结合分子动力学模拟和不同的深度分子生成模型进行GLP-1R小分子激动剂的发现。本工作使用chemical-vae和multiobj-rationale两个生成模型生成大量易于合成且骨架新颖的类药物小分子激动剂。同时也基于GLP-1R靶标,利用虚拟筛选技术对ZINC数据库中1100万个在售、类药的小分子数据集进行筛选。最终,使用分子动力学模拟技术对从上述三种方法中挑取的9个分子(每种方法选择3个小分子)以及参照体系PF-06882961进行研究分析。MM-GBSA结果表明,在选择的9个分子中,只有RL19096分子(-41.91 kcal/mol)与GLP-1R的结合自由能显著低于参照化合物PF-06882961(-31.94 kcal/mol),而ZINC2100521分子(-31.89 kcal/mol)和GLP-1R的结合自由能与PF-06882961非常接近,其余七个小分子的结合自由能均高于PF-06882961。基于上述结果,我们将这两个小分子(RL19096、ZINC2100521)和受体的结合模式与PF-06882961和GLP-1R的结合模式进行对比分析。结果显示,RL19096、ZINC2100521两个小分子和GLP-1R的结合模式与PF-06882961和GLP-1R的结合模式存在许多相似的特征。分子中极性较强的一端通过分子末端羧基与Arg354形成强烈的氢键相互作用,分子极性较弱的另一端则通过靠近或伸入由非极性氨基酸Val10、Leu6、Trp7以及Leu191组成的疏水腔形成疏水相互作用,而分子的中间部位则可以与Trp177、Leu115、Phe355以及Phe359形成较强的疏水相互作用。这些共同特征表明了不同方法生成的分子较好的保持了与PF-06882961类似的活性特征分布,同时结合模式分析也为分子的进一步优化奠定理论基础。本论文主要从分子属性预测方法的可解释性以及结合分子动力学模拟和不同深度分子生成模型进行GLP-1R小分子激动剂的发现两方面开展工作。一方面,我们成功开发了一个高性能且可解释的新型分子属性预测模型。另一方面,我们还使用了两种基于片段的分子生成方法和虚拟筛选技术对新型GLP-1R小分子激动剂进行探索,并通过常规分子动力学模拟验证了得到的分子与受体的结合能力。这些结果对于进一步提升并拓宽深度学习方法在药物设计中的应用及GLP-1R小分子激动剂的发现具有重要的理论和实际意义。
其他文献
防范水体富营养化的关键在于减少污水处理厂尾水中的氮、磷,A~2/O工艺被广泛应用于实际工程以实现高效的脱氮除磷,但其单污泥系统处理低C/N比城市污水存在不足,长泥龄的硝化菌和短泥龄的除磷菌受系统SRT(污泥龄)的限制,使工艺在运行中普遍存在释磷少、硝酸盐产率低、碳源利用率低和抗水质波动性差等问题,升级改造为反硝化除磷脱氮的双污泥系统是目前解决该问题的较好出路。试验以低C/N城市污水为处理对象,设计
近年来,我国桥梁事业飞速发展,波形钢腹板组合箱梁桥作为一种新型组合桥梁结构形式,较之传统预应力混凝土箱梁桥优点突出。随着国内建设的波形钢腹板组合箱梁桥愈来愈多,一种以钢底板取代混凝土底板的新型波形钢腹板组合箱梁桥走进了大众的视线。现阶段,对于这种新型波形钢腹板组合箱梁的研究成果较少,且对于曲线波形钢腹板-钢底板组合箱梁桥的研究就更为稀缺。本文采取理论推导和有限元模拟相结合的方式,重点就双箱单室曲线
随着我国水利事业的快速发展,水利工程的数量和规模都达到了前所未有的高峰,大量水工引水隧洞应运而生。但隧洞的修建不可避免要穿越富水地段,而富水地段的隧洞施工,极易发生突泥涌水等安全事故并破坏隧址区生态环境。本文以引大济湟工程为依托,首先通过统计隧洞突涌水案例,分析隧洞突涌水的内在规律,之后通过对比LSTM、Elman神经网络、线性回归等方法的预测涌水量与隧洞施工实际的涌水量,得到预测隧洞涌水量最优方
独-斜塔混合梁斜拉桥作为一种结构较为新颖且复杂的斜拉结构,对该类桥梁的参数化研究相对较少。同时出于合理设计的考虑,对此类桥梁进行静动力参数化分析也是十分必要的。故本文选择一地区条件较为复杂的独斜塔钢-混混合梁单索面跨海斜拉桥为例,进行静动力参数化分析如下:(1)将斜拉结构简化,以主梁位移为研究对象,建立不同梁段位移插值函数。随后通过能量法求得斜拉结构总势能,应用Ritz法对各位移插值函数待定系数解
光敏性皮肤病及皮肤炎症是由于紫外线照射、空气污染等因素引起的使患者出现皮肤变薄、皮肤红斑水肿及灼热瘙痒等临床表现的一种疾病。精神紧张与自身压力等问题都会导致机体自身的内分泌失调,使得皮肤的抵抗能力与自愈能力逐渐下降。光敏性皮肤病及皮肤炎症受到地理、种族、年龄、饮食等多方面因素的影响,在各种环境问题爆发、人民生活方式改变的大环境下,我国居民光敏性皮肤病及皮肤炎症的发病率呈逐年递增的趋势。天然化合物源
基于对国内外在强化生物除磷(EBPR)工艺方面的研究现状和发展趋势的大量调研和分析,发现无论是实验室培养的以NO2-为电子受体的反硝化吸磷系统还是不同工艺污水处理厂的活性污泥中“Candidatus Accumulibacter Phosphatis”菌属几乎均以其II型(简称为PAO II)为主导。PAO II的优势存在不以地区、温度、水质变化及工艺是否具备EBPR能力等因素而改变。然而,现有的
波形钢腹板钢-混组合箱梁作为一种新型结构,不但降低了桥梁自重,提高了桥梁的承载力,也使得钢材和混凝土两种材料的力学性能得到充分发挥。由于混凝土材料随着时间的增加同时也伴随着徐变的产生,而钢材没有,这两种材料的结合会随着时间变化而改变。徐变效应会引起箱梁截面应力重分布,也会影响载荷长期作用下箱梁剪力滞。本文针对单箱双室波形钢腹板钢-混组合箱梁进行了公式理论推导与数值模拟,探究徐变效应对剪力滞的影响。
喹啉骨架具有抗癌、抗炎、抗菌、抗病毒、抗真菌、抗氧化和自由基清除活性等广泛的生物活性,倍受研究者青睐。尤其是以喹啉为核心骨架进行抗菌药物的开发,具有潜在的应用前景。课题组前期研究发现2,8-二(三氟甲基)喹啉是优良的抗菌先导分子,因此,本论文以2,8-二(三氟甲基)喹啉作为先导模型,通过多样性导向合成和活性官能团导向合成策略在4位引入活性基团和优势抗菌片段,合成多个系列衍生物,系统评价其对农业病原
近年来随着我国交通建设规模的不断扩大,桥梁工程得以快速发展。当遇到地形复杂的沟谷地区时,将不可避免的采用大跨径高墩桥梁。然而当桥墩过高时,以往采用的型式所需要的混凝土用量大幅增加,导致自重过大、经济性低,并且其刚度以及抗震性能不满足要求。为了减小混凝土的自重、提高经济性能,同时保证桥墩的安全,桥梁工程中开始使用新型格构式高墩。在格构式高墩的施工以及使用过程中,桥墩的稳定性与安全性极其重要。为了研究
“十四五”规划和2035年远景目标的确立,能够深入推进“一带一路”合作倡议。重要内容之一便是优化国土空间布局,其内核是中西部省区在有条件的前提下培育多个“中心城市”,在这动态探索过程中,中西部地区必将迎来新一轮发展基建的高潮。广泛分布于西北干旱与半干旱地区的黄土,由于其特定的生成环境和赋存环境,在漫长的地质年代中经历了长期、多循回地质作用,故其土体参数具备较为显著的空间变异性,且具有天然含水率低、