基于格点和关联图模型的蛋白质结构预测与比对算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:misskiller
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
后基因组时代研究的核心内容之一就是阐明蛋白质的功能,因为蛋白质是生理功能的执行者以及生命现象的体现者。研究表明,蛋白质的生物功能由蛋白质的结构所决定,因此在研究蛋白质时需要了解蛋白质的空间结构。然而,受到蛋白质结构和功能获取实验技术的限制,已知序列的蛋白质远远多于已知结构和功能的蛋白质。因此理论预测蛋白质结构与功能的方法不断涌现。本文从优化算法设计角度出发,研究了基于格点模型的蛋白质结构预测问题,基于蛋白质关联图的结构预测和结构比对问题。主要工作如下:   基于优化理论的思想,分别建立了二维(2D)和三维(3D)疏水,亲水(HP)格点模型。对于2DHP模型,提出了一种GA-EO混合算法求解蛋白质结构预测问题。算法以遗传算法(Genetic Alagorithm)为框架,极值优化(Extremal Optimization)作为变异算法。对于3DHP模型,提出了一种EO-PERM混合算法求解蛋白质结构预测问题。算法以极值优化(EO)为框架,增长型算法PERM(pruned-enriched Rosenbluth method)为邻域搜索策略。在极值优化算法中,分别给出了适合2DHP和3DHP模型的局部适应度定义。测试的结果表明:在一定规模下,混合算法可以找到测试序列在格点上的最低能量状态。   引入了一种改进的COMAR算法来求解基于关联图的蛋白质结构预测问题。算法首先根据蛋白质关联图和先验知识以半随机的方式生成距离信息,然后根据距离信息得到蛋白质的坐标表示,最后通过坐标修正和摄动使得重构结构的关联图与给定的关联图相一致。结果表明阈值较大的关联图重建的结构比阈值小的要好。此外,改进COMAR算法与原COMAR算法在相同的达代次数下,算法的精度有所提高。基于序列比对中的相似度矩阵,提出了一种蛋白质关联图的相似度矩阵表示,并用Greedy-EO混合算法求解基于关联图的蛋白质结构比对问题(关联图重叠问题CMO)。算法首先基于关联图相似度矩阵,应用贪婪算法得到问题的初始解,然后采用极值优化算法得到问题的近优解。相似度矩阵由蛋白质残基特征的相似度组成,它是产生初始解的重要依据,也是极值优化算法中邻域搜索的准则。一共采用了五种策略定义相似度矩阵。与多项式时间近似算法PTAS方法比较,算法速度快,解的质量也有所提高。与分支缩减算法比较,所得的相似性指标互有高低。受TOPS模型的启发,提出了蛋白质关联图的等价向量表示,并用Hungarian-EO混合算法求解CMO问题。算法首先引入向量集合来等价表示蛋白质关联图,然后计算关联图的相似度矩阵,接着构造基于相似度矩阵的带约束的分派问题,作为CMO问题的初始解,最后采用极值优化算法获得最终解。与Greedy-EO算法的比较结果表明,Hungarian-EO有效提高了解的质量。与DALI的结果比较表明,某些例子混合算法所得的解有所提高,某些例子混合算法所得的解不及DALI。此外,通过绘制蛋白质相似网络来测试混合算法的蛋白质分类效果,选择一定的阈值,蛋白质相似网络可以分为5个子网络对应于5个家族。
其他文献
神经网络是基于对人脑组织结构、活动机制的初步认识而提出的一种新型信息处理系统。它具有高度并行的非线性、分布式存储和并行协同处理特征。分式神经网络是杨国为提出的有
在空间观测系统中实时跟踪空间非合作目标,并精确测量其形态,是实现空间对接、规避太空垃圾以及进行空间维修等任务的重要条件。目前针对空间目标形态测量的方法有很多,但是大部
随着现代工业的发展,各个领域中的生产和工程都已对大尺寸测量提出了期望和明确要求,数字摄影测量技术已广泛应用于大尺寸精密测量中。工业数字摄影测量是建立在专业像机摄影
航天科技日益发展,航天器需要具有很高的姿态控制精度,以完成各种精细复杂的空间任务,而现代航天器通常携带有挠性附件,在挠性航天器姿态机动的过程中,存在于挠性附件与中心
基于机载视觉的地面目标跟踪技术,不仅在现代战争中发挥着重要的作用,而且在森林防火、城市安防方面也发挥着不可替代的作用,而其中的关键就是对移动目标跟踪算法的研究。随
随着计算机视觉技术的不断发展,常规摄像机的视角范围已经不能满足许多场合的需求,而鱼眼摄像机本身的视场范围广、涵盖信息多等优点,使得它在军事和民用领域越来越受到人们
可再生能源的综合利用对我国社会经济的可持续发展和环境保护起着重要的作用。利用可再生能源组成独立供电系统,对解决偏远地区的供电问题具有重要意义。太阳能和风能是目前可再生能源中使用最广泛的两种能源。太阳能和风能在资源和技术方面都有着很好的互补性,实践证明风光联合供电系统是一种比较经济的发电系统,所以对风光联合发电系统的研究是非常必要的。本文以可再生能源的综合利用为指导思想,结合风能、太阳能特点,以风光
目前,以PID控制为代表的传统控制算法以及以近几十年来发展起来的预测控制算法为代表的先进控制算法无论是在理论上还是实际工业应用中都已经非常成熟。并且这些算法从产生开
PID控制技术从出现至今已经发展了80余年,在工业生产过程中发挥了非常重要的作用,而且其仍在工业生产过程中处于主导地位。PID控制器的性能决定着工业生产设备能否高效和可靠
电真空管制造有很强的工艺性,排气是其生产加工过程中的关键步骤,决定着产品的质量。目前,大多数国内生产厂家的电真空管排气加工仍采用人工控制,人为因素导致的产品质量问题时有