论文部分内容阅读
蛋白质是生物机体内重要的物质,它是生命活动的主要承担者。绝大多数药物进入机体后都是通过与蛋白质发生相互作用进而对人体产生作用。药物与生物大分子相互结合、作用的部位称为药物靶点。根据多向药理学可知,药物可能存在多个药物靶点,而且多数的药物靶点都是由蛋白质组成的,因此对药物与蛋白质相互作用预测的研究,有利于药物重定位、缩短药物的开发时间。传统的药物靶向蛋白质作用研究采用生物实验方法确认药物与蛋白质是否会发生相互作用,这种方式需要耗费大量的成本与时间。由于基于计算方法的药物与蛋白质的相互作用预测方法可以极大地降低预测成本,所以使用计算机模拟、模式识别等手段预测药物与蛋白质的相互作用成了一项重要的研究工作。目前已有大量的基于计算方法的药物与蛋白质的相互作用预测方法的研究。本文提出了一种基于深度置信网络的药物-蛋白质相互作用预测算法:从药物的分子结构出发,提取药物的扩展连通指纹,从蛋白质的氨基酸序列出发,提取了蛋白质的三肽结构特征,将药物的扩展连通指纹和蛋白质的三肽结构特征两两拼接,构成一个药物-蛋白质特征向量,之后输入到深度置信网络中进行训练,网络的输出为网络输入的药物-蛋白质对发生相互作用的概率,最后选择合适的阈值判断这一对关联是否成立。本文的方法可以预测新加入的药物或蛋白质的潜在相互作用。实验阶段,首先在四个标准数据集中与三种方法下进行比较,然后在Drugbank数据集下测试了本文的方法效果,实验表明了本文的预测方法能提升预测精度。最后,基于本文使用的预测方法构建了一个用于展示算法效果、适合科研人员使用的药物-蛋白质相互作用预测系统。