论文部分内容阅读
蛋白质的生物功能是由其空间折叠结构决定的,因此预测蛋白质的折叠结构是生物信息学领域中极具挑战性的问题之一。近年来,许多研究者从事蛋白质简化模型的研究,这些模型基于热力学假说,即蛋白质的天然构象是自由能最低的构象。蛋白质折叠结构中最为典型的数学模型之一是Toy模型,基于Toy模型的蛋白质折叠结构预测问题是一个典型的NP问题。在Toy模型的基础上,已经有各种优化算法用于蛋白质折叠结构的预测。但是这些方法仍存在着不足,在蛋白质序列长度较长的情况下,算法容易产生早熟收敛,难以收敛到全局最优解,从而影响预测的精度和效率。针对Toy模型多变量多极值的特点,本文基于粒子群优化算法(以下简称为PSO算法)对连续型函数求解的较大优势,通过修改算法结构,提出了两种改进的PSO算法,并应用于二维Toy模型进行蛋白质折叠结构预测。提出的改进算法包括多种群粒子群优化算法(以下简称为MPSO算法)和自适应分工粒子群优化算法(以下简称为ADPSO算法)。前者主要是将每一代的种群分为精英子种群、开采子种群和勘探子种群三部分分别进化,改善种群的局部开采能力和全局勘探能力来提高算法的性能;而后者主要是引入一个局部环境因数从而动态调整子种群规模,能更为有效的利用有限的计算资源进行蛋白质折叠结构的预测。实现的系统分别采用Fibonacci蛋白质测试序列和真实蛋白质序列做了实验检测。实验结果表明,与其他优化算法比较,两种改进的PSO算法不仅提高了极值解的质量,并且增强收敛效率,体现算法良好的性能。同时,通过改进的PSO算法预测得到的蛋白质序列的构形能够在一定程度上反映蛋白质天然结构的一些空间结构特点,即在蛋白质序列的构象中,疏水性残基形成束,总是被亲水性残基包围这一典型特征。两种改进的PSO算法能够精确地进行蛋白质折叠结构预测,为生物科学研究提供了一条有效途径。