论文部分内容阅读
蛋白质三维结构是理解和改造其生物学与细胞学功能的关键。然而,蛋白质三维结构的解析速度远不及新序列的测定速度,因此,利用计算机从氨基酸序列预测蛋白质三维结构是生物信息学亟待解决的一个关键问题。在国内外研究现状的基础上,利用差分进化算法较强的全局搜索能力,结合片段组装及副本交换策略提高算法的采样效率,利用蒙特卡罗算法对种群做局部增强,根据距离谱设计诱导构象距离模型及距离接收概率,并将其引入到算法的选择环节,引导构象种群向能量更低且结构更为合理的区域进化。本文的主要工作和研究成果有以下几点:(1)综述了蛋白质三维结构预测问题的研究背景和意义,阐述了现代进化算法和能量模型的基本概念和发展历程,重点介绍了进化算法在蛋白质结构预测上的研究和应用现状。(2)针对蛋白质结构预测方法中采样能力不足的问题,在差分进化算法的框架下,引入副本交换策略。在每个副本层设置构象种群,采用差分进化算法对种群进行更新,然后利用蒙特卡罗算法对种群做局部增强,以此得到全局和局部最优构象。差分进化算法较强的全局搜索能力对构象空间进行有效的全局搜索,副本交换策略保证种群的多样性,增强算法跳出局部极小的能力,从而提高了构象空间的采样能力。10个目标蛋白质测试结果表明,所提方法能够快速有效的对构象空间采样,得到高精度的蛋白质近天然态构象。(3)针对蛋白质结构预测中能量函数不精确的问题,将基于距离谱知识的诱导构象距离模型及距离接收函数作为结构相似度指标,引入到群体算法的选择环节中,减小能量函数不精确性带来的偏差,优化蛋白质构象空间搜索,提高了采样效率。引入诱导构象残基间距离模型作为结构相似度指标辅助算法收敛,避免算法陷入局部最小值,使得算法能在结构更加接近于天然态构象的区域采样,进而更加可靠的得到精度更高的构象。20个目标蛋白序列的测试结果表明,所提方法能够实现对构象空间快速有效的采样,可靠的得到测试蛋白的近天然态构象。