蛋白质结构预测的现实求解方法——高效启发式优化算法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:radcuijun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构预测问题是计算生物学领域的核心问题之一,对其求解是后基因时代蛋白质工程的一项重要任务。已经证明,即使按最简化的数学模型,所导出的问题仍然是NP难度的。因此,蛋白质结构预测问题的研究在当今国际学术界是一项具有挑战性的重大课题。求解NP难度问题的方法主要有三种完整算法、近似算法和启发式算法。完整算法虽然能保证给出最优解,但由于人们普遍相信P6=NP,指数级的计算复杂度导致其在实际应用中很难求解较大规模的问题实例。近似算法能保证在最坏情况下所得解的精度与最优解之间的误差在一定的范围内,但其实际计算效率往往不能令人满意。另一种方法是启发式优化算法。启发式算法的主要思想来源于生物世界和社会现象,它往往可以在算法速度和精度之间达到一种很好的平衡,有可能在较短时间内求解大规模的问题实例,并达到令人满意的精度。拟物拟人算法是一种借助物理知识和人类社会经验来求解NP难度问题的启发式方法。对于蛋白质结构预测问题,当前的研究重点是设计求解该问题的高效启发式优化算法。研究了蛋白质结构预测问题的两个简化模型—-HP格点模型和AB非格点模型。HP格点模型中,PERM算法不够简洁,不便于理解。AB非格点模型中,没有非常贴近问题本质的高效求解算法。对于这两个模型,文献中算法的计算效率不够高。对于HP格点模型,PERM(Pruned-Enrichment Rosenbluth Method)算法是当今国际文献中最先进的求解算法。   本研究在介绍PERM算法的基础上,对其给出了一种拟人解释—-人口控制策略,使该算法变得好想,易于理解,对算法中的权重及预测值进行了改进,并对选择动作时不同情况下的权重计算公式进行了统一。综合这些策略得到了改进的PERM算法。在此基础上提出了进一步的拟人改进策略。根据拟人思想对权重预测公式进行了重新定义,拟人改进后的PERM算法在链生长过程中不仅考虑氨基酸的类型(H或P),同时考虑氨基酸在整个链中的位置。拟人改进的PERM算法的计算结果可概括为以下三点:第一,算法的计算速度要优于目前国际文献中最先进的求解算法—-nPERMis(new PERM importancesampling),计算速度是nPERMis的几倍到几十倍。第二,对一个链长为103的标准问题实例,拟人改进的PERM算法得到的最低能量为-55,该最低能量要优于nPERMis算法所得的最低能量-54。第三,对一个链长为46的标准问题实例,拟人改进的PERM算法首次得到了最低能量-35,该最低能量要优于文献中所报道的最低能量-34。对于AB非格点模型,找到了贴近问题本质的物理模型—-弹簧模型。在此基础上通过将原始约束优化问题转化为无约束优化问题,提出了求解基于AB非格点模型的蛋白质结构预测问题的拟物算法。拟物算法的思想基于所提出的物理模型。拟物算法及其计算结果可概括为以下三点:第一,算法提出的拟物思想很好地贴近了问题的本质。第二,以HP格点模型为基础生成初始解,算法所得解的精度要优于一种以PERM算法生成初始解的共轭梯度法所得解的精度。第三,以ELP(EnergyLandscape Paving)算法为基础生成初始解,对于绝大多数文献中的标准算例,拟物算法所得解的精度要优于国际文献中最先进的几个求解算法所得解的精度。以上研究成果表明:拟物拟人策略是求解蛋白质结构预测问题的一种有效途径。进一步工作将研究基于更加真实的数学模型的蛋白质结构预测问题的高效启发式求解算法,以期在不久的将来将其应用于蛋白质工程的实践中去。同时,沿着拟物拟人的途径,有望为其它NP难度问题设计出高效率的求解算法。
其他文献
agent系统由于其自身的特点:在动态的、不可预测的、开放的环境中具有自主行为,在电子商务中扮演了重要角色。但是由于所有权不同,agent可能是自私的和不可靠的。没有一个agent
随着应用需求的扩展和技术的不断进步,多核已经开始在传统PC,甚至嵌入式系统广泛应用。正因如此,多核环境下的并行应用,实时计算也成为研究的热点,但是这些都需要从操作系统
并行程序设计是并行计算中一个公认的难题。其中一个重要原因在于缺乏系统的开发并行程序的方法及其支持工具。现有的大多数并行程序设计模型本质上是对并行程序编码的研究,
近年来,随着我国通信网络基础设施的快速建设,视频会议系统由于可以为处于多点的与会者提供音视频等多种信息,节省大量费用,提高工作效率,因而发展迅速。由于H.264编码更加节省码流
无线传感器网络是最近几年来颇受世界关注的一种网络技术,与当前的移动通信网络、无线局域网等相比较,无线传感器网络具有很大的发展潜力。首先,无线传感器网络是无需基础设
P2P(Peer-to-Peer)技术被视为21世纪计算机技术的热点技术之一,随着网络技术的飞速发展和个人计算机性能的增强,互联网的计算模式正经历着从C/S模式向P2P模式的转变。高效的资源
在现代科学研究和应用领域中,大量的数据是重要的资源。地理上广泛分布的科研工作者或用户都希望能够访问和分析这些庞大的数据。另一方面,海量的科学数据分布在各种自治管理域
传统的人工阅卷缺乏对阅卷过程的有效监督,难以保证考试公平公正的要求,阅卷的对象是纸质试卷,对试卷的运输、保存和查阅等工作需要大量的人力。随着计算机技术、网络技术、
数字图像压缩是图像处理领域的一个热门研究课题,其研究成果为图像的存储、传输带来了极大的便利,因而具有重要的研究价值。在众多的图像压缩方法中,基于小波变换的图像压缩方法
随着游戏产业的飞速发展,3D游戏引擎的研究受到了前所未有的关注。一个好的3D引擎是构成一款高性能游戏的基石,它包含了物理学,计算机图形学,人工智能等多个学科的研究成果。它所