基于深度学习的蛋白质-配体相互作用预测

来源 :山东大学 | 被引量 : 0次 | 上传用户:gb1107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物研发是一个漫长、复杂的过程。据统计,一款新药从研发到上市通常需要花10年以上的时间,且成本投入在10亿美元以上。高额的时间和经济成本投入是药物昂贵的主要原因。随着计算机技术的快速发展以及可访问数据库的激增,计算机辅助药物设计(CADD)在药物研发中发挥越来越重要的作用。基于化学分子与靶体之间的结构,理论预测结合亲和力来确定先导化合物是CADD的核心技术。因此,亲和力预测的准确性将决定虚拟筛选的结果,进而影响实验的成功率。近些年,随着人工智能(AI)的广泛应用,应用机器学习(ML)和深度学习(DL)算法来设计打分函数成为目前的研究热点。诸多研究表明,基于ML/DL的打分函数比传统的亲合能预测方法更准确。本论文基于DL算法提出了两种基于物理知识预测蛋白质-配体相互作用的打分函数——OnionNet-2和DeepRMSD+Vina。与其它打分函数相比较,本论文提出的方法对配体打分的准确性有明显提高。本论文主要的研究内容如下:1、我们基于卷积神经网络(CNN)设计了一个预测蛋白质-配体结合亲和力的打分函数——OnionNet-2,通过不同距离区间的残基-原子对的接触数来对蛋白质-配体相互作用进行表征。以CASF-2016 core set为测试集时,当残基-原子对之间距离阈值增加到1.55 nm,OnionNet-2实现的皮尔森相关系数达到局部最高;当增加到3.05 nm时,皮尔森相关系数达到全局最大值0.864,均方根误差(RMSE)为1.164。以CASF-2013 core set为测试集时,其实现的皮尔森相关系数和RMSE分别为0.821和1.357。OnionNet-2在这两个数据集上的表现领先当前几乎所有已报道的打分函数。此外,OnionNet-2在CSAR NRC-HiQ数据集和非实验结构数据集上同样表现优异,证明了其具有较强的泛化能力。2、我们基于范德华和静电势对蛋白质-配体相互作用进行建模,结合CNN算法设计了一个预测配体结合姿势RMSD的打分函数——DeepRMSD。该打分函数旨在从对接软件生成的众多结合姿势中选出接近天然构象的结合姿势(对接能力)。我们还将DeepRMSD与传统的打分函数AutoDock Vina相结合得到了一个新的打分函数DeepRMSD+Vina。经过探究,DeepRMSD+Vina能实现更高的对接成功率。在CASF-2016对接能力测试集上,DeepRMSD+Vina的Top 1成功率达到95.4%,显著领先排名第二的AutoDock Vina(90.2%)。基于DeepRMSD+Vina打分函数,本文提出了一个配体构象优化框架用于提高分子对接产生的结合姿势的质量。在CASF-2016对接测试集上,对于RMSD小于3 ?的结合姿势,该优化框架的优化成功率能达到70%以上。在两个实际应用场景(redocking和cross-docking)中,DeepRMSD+Vina与该优化框架相结合能极大地提高对接成功率。因此可以证明我们提出的打分函数和配体构象优化框架具有较高的实用价值。通过结构分析发现,该优化框架有能力还原出氢键。本论文系统阐述了 OnionNet-2和DeepRMSD+Vina的物理理念、建模特征以及预测性能,为基于机器学习算法的药物虚拟筛选提供了快速、准确的解决思路。
其他文献
近年来,随着高等教育国际化水平的不断提高和国际学生数量的日益增长,高校的外事翻译任务愈加重要,尤其是与国际学生管理工作相关的翻译材料,其内容紧跟时代步伐,翻译主题复杂多样,翻译数量庞大,属于外事翻译中比较特殊的一类。译者既要考虑到外事翻译的时代性、政治性以及准确性,也要考虑到国际学生这一类群体的特点,故值得探究。本实践报告是以作者工作中的外事翻译任务为实践基础撰写的。在国际学生管理工作中,统一使用
学位
随着社会的进步,人们对健康生活愈加重视,便携式检测治疗设备和智能穿戴电子产品走入千家万户。这些产品具有体积小且续航时间长的需求,但如今新电池材料研究进入瓶颈期,因此芯片的低功耗设计显得尤为重要。模数转换器(ADC)是芯片中必不可少的结构,其负责将采集到的连续信号转换为电子设备可识别处理的0/1信号。在所有ADC类型中,逐次逼近型(SAR)ADC具有电路简单、功耗和芯片面积小的优点。本文基于TSMC
学位
局部麻醉药物已被广泛应用于临床上,大大降低了患者的疼痛感。但仍存在一些问题,注射用局麻药存在毒性大,给药不方便的缺点。透皮给药系统具有避免肝脏首过效应,控制药物输送,减少给药频率,改善患者的依从性等优点。目前已有的透皮用局麻药虽然使用方便,大大提高了患者的依存性,但仍存在起效慢的缺点。因此,临床上急需一种毒性小、起效快、麻醉时间长的透皮用局麻制剂。本课题旨在制备一种局麻药醇质体,应用于透皮给药系统
学位
为解决畜禽粪污资源化利用成本高、周期长、效率低、易造成环境二次污染的问题,本研究利用高温好氧发酵技术,将畜禽粪污在15 d内转化为可供大棚果蔬生长使用的生物有机肥,产品质量符合NY 884-2012《生物有机肥》中相关指标要求,实际应用效果理想,整个处理过程对环境友好。
期刊
快速傅里叶变换(Fast Fourier Transform,FFT)是离散傅里叶变换(Discrete Fourier Transform,DFT)的一种优化算法。FFT降低了 DFT的计算复杂度,当计算的点数逐渐增大时,这一优化效果体现地越明显。通用FFT模块一般都是基于FPGA内部的IP核。这种类型的FFT模块对于可计算的数据点数以及数据位宽都有固定的范围,而且它的输入端口以及输出端口都是固
学位
铁电压电单晶材料通常不仅具有非常高的压电系数和机电耦合系数,同时还具有非常低的介电损耗和较高的机械品质因数,所以在医用超声成像仪、水声换能器以及压电驱动器等领域有着广泛的应用。本论文对钽铌酸钾(K(Ta,Nb)O3,KTN)基单晶和铌镁酸铅-钛酸铅(PMN-PT)系单晶的物理性质进行研究。系统研究了 KTN系单晶的结构特性、应变特性、介电性能和压电性能,研究了交流极化对不同取向、不同组分和Mn掺杂
学位
有机光电材料在电、磁、光性质方面具有半导体性质;在化学与机械性质方面具有有机化合物所共有的柔软、耐腐蚀以及制备成本低廉等特性。这些特性使得有机光电材料在有机发光二极管、有机太阳能电池等新一代功能器件中扮演着重要角色,有机层材料的侧链修饰、掺杂、合成方式、形貌结构等均会对器件功能产生显著的影响。同时,21世纪初,有机材料中的自旋注入和输运、有机自旋阀效应以及有机磁电阻效应的相继发现催生了有机自旋电子
学位
心血管疾病是影响人类生命健康的重大疾病之一,且其发病率和死亡率呈逐年提高的态势,因此加强对心血管系统健康状况的监测成为一种刚性需求。随着硬件技术的快速发展以及5G技术的逐渐普及,使用可穿戴式心电设备监测实时动态心电信号成为可能。但是由可穿戴式心电设备获得的动态心电信号数据量非常庞大,并且其中一部分受严重的噪声污染无法用于临床诊断,因此对获取的心电信号进行质量评估具有很重要的现实意义。使用深度学习的
学位
有机半导体材料,包括有机高分子材料和有机小分子材料,因其具有光学带隙更易调节和更容易在柔性沉底上进行低成本、大面积处理的优点,在半导体光电领域受到人们的广泛关注。相较于无机半导体,有机半导体具有较强的电子-晶格相互作用,这使得有机半导体内的载流子不再是传统意义上的电子或空穴,而是形成带有晶格结构的孤子、极化子和双极化子等。此外,当对有机半导体进行光激发或电激发时,会形成激子和双激子等具有“自陷性”
学位
自2004年石墨烯首次成功制备以来,二维纳米材料受到了研究人员的广泛关注,在多个研究领域都具有重要研究价值。随着研究的深入,二维纳米材料家族的种类日渐丰富,除石墨烯外还包括硅烯、黑磷(BP)、过渡金属硫化物(TMDCs)等。其中,TMDCs作为二维材料家族类石墨烯材料的典型代表,除具有良好导电性、导热性、柔韧性等优异性质外,还具有良好的吸附动力学、较低的气体吸附能和较高的表面体积比,这些性质使得T
学位