论文部分内容阅读
蛋白质结构从头合成的预测方法能揭示蛋白质折叠的热力学和动力学特性,然而构象搜索在现有计算条件下很难实现。为了提升构象搜索的效率,需要采纳粗粒化的格点模型。在格点模型中,所使用两类算法一是基于链增长模式的算法,以回溯法为代表,第二类是非链增长模式,以蒙特卡罗算法为代表。蒙卡程序结构简单,占用内存单元较少,但缺点是收敛速度慢,尤其对于长链。尽管回溯法能够处理庞杂的以及规模较大的难题,但时间复杂度较大。因此如何将两类算法有机结合,在缩小构象空间的同时还能够提高搜索效率,对于蛋白质的结构预测具有重要的意义。 本研究是探究蛋白质折叠过程的优化方法。蛋白质折叠问题是基于它的氨基酸序列预测它的三维构型。本研究重点围绕从头合成的蛋白质亲疏水结构的预测途径,尝试去寻找三维格点模型的优化条件。 本文比较了三种算法,传统蒙卡、副本交换蒙卡、回溯法。并且将回溯法产生的结构用蒙卡算法进行精修,得到最终的预测蛋白质的构象。将研究方法和结果总结如下: 首先比较了传统蒙卡和副本交换蒙卡:结果表明副本交换蒙卡算法比单一蒙卡算法更有效、且构象能量更低。原因在于蛋白质的构象空间概率密度分布复杂,传统蒙卡相比副本交换蒙卡更易进入“局部优化陷阱”。 其次改进了回溯法:为了降低回溯法的时间复杂度,用疏水氨基酸距离和作为描述蛋白质分子的自由能函数,以此给每个分支打分,并沿能量最低分支继续链增长,直到完成整个氨基酸序列。 再次,对回溯法同蒙卡进行了比较。短序列蛋白结构预测结果表明回溯法的构象搜索在能量给定的前提下,速度上优于蒙卡程序;但是在解除时间约束条件下,回溯法预测构象的能量要高于蒙卡算法预测的构想能量。相反在长链构象搜索中,回溯法无论在速度上和构象能量搜索中都优于蒙卡算法。原因在于随着氨基酸链的增加,构象空间概率密度分布会更加复杂,因此蒙卡算法无论是传统蒙卡还是副本交换蒙卡都会更容易进入“局部优化陷阱”。 最后将回溯和传统蒙卡结合,短链蛋白质的结构预测结果表明两者的结合有效的弥补两者的不足,构象的能量同副本交换的蒙卡相同,但是速度上优于后者;长链预测结果表明回溯法和蒙卡结合性能上要全面优于副本交换蒙卡算法,无论在搜索速度上,还是构象的最低能量上以及最终的三维结构近似程度。 由此可知,结合回溯法和传统蒙卡的方法既有很高的搜索效率,搜索结果更逼近蛋白质的天然构象。在蛋白质结构预测方面性能上要远远优于传统蒙卡和副本交换蒙卡以及回溯法。