论文部分内容阅读
尽管对接软件可以产生很接近晶体结构的几何构型,但是虚拟筛选的成功率却不总能尽如人意。通常,经验的打分函数来自于大量的已知实验结合数据的蛋白配体复合物。但是拟合或训练一个适用于所有种类靶标的打分函数是一件很困难的事。而且,在大部分的打分函数中通常认为蛋白配体非共价键相互作用是线性加和的,然而这一点却不总是成立的。对于虚拟筛选来说,一个很重要的问题就是提高区分活性分子与非活性分子的能力。降低虚拟筛选过程中的假阳性率是一件具有挑战性的工作。在虚拟筛选的实际应用中,推荐使用针对特定靶标的打分函数。我们发展了一种基于蛋白配体相互作用分解和机器学习的分类模型。我们以蛋白配体经验的相互作用能量项(PLEIC)作为蛋白配体相互作用的描述符,并利用支持向量机对其进行训练,发展了针对特定靶标的分类模型(PLEIC-SVM)用以区分活性分子与非活性分子。数据集为实验上有活性与非活性数据的特定靶标。我们从DUD-E数据库中取了 36个靶标用以模型训练和验证。结果表明PLEIC-SVM模型相比于对接软件GLIDE中Glide SP打分函数可以更好的区分活性与非活性分子。PLEIC-SVM模型是非线性的分类器有助于考虑相互作用项之间的耦合,而且可以捕获可以区分活性与非活性分子的重要相互作用模式。在计算化学中,理论计算蛋白-蛋白结合自由能是一项挑战性的工作。研究表明,尽管蛋白蛋白表面是由很多残基组成的,但是真正对蛋白-蛋白结合稳定性起作用的残基却只有几个:热点残基。PPIs障碍可引起许多疾病,主要是由于异常变化,包括缺乏盐桥,疏水相互作用减弱,空间位阻的形成。热点区域的变化是引起PPI紊乱的最重要因素之一。准确计算热点残基对蛋白-蛋白结合自由能的定量贡献对于阐明结合机制是非常有帮助的。MM/PBSA方法已被成功的应用于热点残基的预测。在这些研究中,变异前后熵变的影响通常认为相互抵消,所以在计算结合自由能时不考虑熵变。我们系统地研究了熵变对于热点残基预测的影响。我们发展了一种基于相互作用熵和MM/GBSA的计算特定残基对于结合能贡献的方法。在该方法中,熵变对于结合能的贡献是通过相互作用熵的方法得到的。相互作用熵是由气相下的结合能的浮动决定的,计算速度快,数值稳定性高。我们取了 SKEMPI数据库中存在丙氨酸变异数据的24个蛋白蛋白复合物来评估该方法。结果表明通过将熵的贡献引入,计算得到的丙氨酸变异结果与实验值更为接近。