基于注意力池化网络的可解释性药靶亲和度预测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:laiwuywg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在药物发现的课题中,我们可以通过研究药物和蛋白质相互作用来达到发现药物的目的。药物蛋白质亲和度指的是药物和蛋白质相互作用后结合的强度。因此找出蛋白质和配体药物的亲和度问题至关重要。最早期,药物发现只能依靠人们偶然发现。直到生物、化学等学科逐渐发展起来后,人们在实验中发现了药物。并且随着生物化学研究的深入,人们可以开始有目的性的设计药物。但是直到这个时期,所有的药物发现课题都只能依靠临床实验的方式进行,然而临床实验的方式耗时长且花费大,并且成功率也无法得到保证。随着计算机学科的发展,计算方法被引入药物发现的课题中。在预测药物蛋白质相互作用亲和度问题上,计算方法表现出了卓越的优势。不仅成功率更高、速度更快,而且极大地降低了经济成本。目前主流的计算方法主要有以下几种:基于分子对接方法、基于相似度的方法和基于机器学习方法。基于分子对接的方法需要了解蛋白质和药物小分子的三维结构,在三维空间中找到蛋白质和药物的最佳结合位点,并预测结合亲和度。基于相似度的方法主要依赖于一个假设:具有相似序列和结构的药物或蛋白质应该在其生物功能的表现上也具有相似性。而目前最主流的方式是使用机器学习的方法,机器学习方法主要依赖机器的计算能力去学习蛋白质和药物中潜在的一些特征,从而达到能够预测未知蛋白质和药物亲和度的目的。但是目前的很多运用于药物蛋白质亲和度预测的机器学习方法都不具备可解释性。本文提出了一种基于Attentive Pooling Networks的药物蛋白质亲和度预测模型,并且该模型具有生物层面的可解释性。该模型在数据处理部分的主要特点是运用了“分词”的方法,而网络部分主要特点是运用了双向注意力机制。实验部分,依据蛋白质的两种不同表示方式(氨基酸序列、结构域和基序)设置了两组实验,最终实验结果表明使用结构域和基序来作为蛋白质表示能够达到更好效果。此外,本文还设置了三组对比实验,前两组分别去掉实验中数据处理部分的“分词”思想和网络构建部分的双向注意力机制思想,与原实验模型的结果进行对比,最终实验结果表明缺少任意一个部分都会使实验的结果变差。第三组中,对比在实验模型中使用LSTM和GRU处理蛋白质和药物的结果差异,结果证明使用GRU的效果略好于使用LSTM。
其他文献
煤层气井机械人工举升-速度管柱连续排采装置的设计研究得到了国家重大科技专项:“柳林示范区煤层气井高效排采工艺技术研究”(编号:2011ZX05062-004)和国家自然科学基金“煤
金佛手是一种芸香科柑橘属植物,多年来其应用范围局限于室内盆景观赏以及简单的农产品加工,产品应用附加值较低。由于柑橘类提取物在化学成分上具有相似性,而柑橘类提取物在
含硫的砜和硫醚类化合物,因其独有的特性广泛应用于医药领域。其中砜类化合物可作为小分子PLK1抑制剂以及TRPV4受体的拮抗剂;芳胺烷基硫醚具有广泛的生物活性与药理活性可以作为镇痛药和5-HT4受体拮抗剂。因此,这两类化合物的活性和合成方法学研究受到人们的广泛关注。克服传统合成工艺步骤繁琐的缺点,实现砜和芳胺烷基硫醚类化合物的高效合成,已经成为药物合成工业中热门的研究内容和重要的研究目标。本论文主要
老龄化社会的到来对我国《民法通则》中的监护制度提出了新挑战。《民法总则》适应时代要求,对于监护制度作了若干重要修正与补充,包括无民事行为能力或者限制民事行为能力的
股权买卖是现代企业并购的重要手段之一,在股权买卖中往往会出现各种各样的瑕疵状况,比如股权被质押或者企业所属的各项财产出现瑕疵等等,对于这些瑕疵应当如何处理,我国法律
目的:了解神经重症患者合并医院获得性肺炎的危险因素,并分析生阶梯治疗及降阶梯治疗方案的疗效对比。方法:回顾性分析2017年6月-2019年1月在山西医科大学第一院入住神经外科重症观察室的189例神经重症患者,使用医院感染监测系统及出院病历系统收集病历资料,收集内容包括:性别、年龄、高血压病史、糖尿病病史、吸烟史、COPD病史、冠心病病史、误吸、呛咳反射、GCS评分、气管插管时间、机械通气时间、住院
为了防止农民专业合作社的理事长、理事和管理人员违反忠实义务,利用职务便利、牺牲合作社的利益、为自己牟取利益等问题出现,《农民专业合作社法》第三十六条对农民专业合作
为研究多旋流LPP燃烧室的两相燃烧过程,本文发展并完善了大涡模拟湍流两相喷雾燃烧数值仿真程序DELTA。应用该程序对多旋流LPP燃烧室三维非稳态冷态流场与两相喷雾燃烧流场进
在地质学领域中,砂岩薄片的鉴定对于油气勘探具有重要的指导意义。当前主要通过人工观察的方式分析砂岩薄片,消耗大量时间和人力成本,并且因分析人员经验不同造成鉴定质量良
目的通过建立大鼠肝纤维化模型,探讨reversine治疗对肝纤维化的影响及调控肝纤维化炎症信号通路的相关机制。方法1.随机将健康雄性SD大鼠25只分成对照组(5只)和模型组(20只)