【摘 要】
:
自第一个使用鸟枪法成功地完成流感嗜血杆菌完整的基因组测序以来,基因组被完全测序的物种数量每年都在飞速增长。当两个非常相近物种的完整基因组可以获得的时候,首要的问题
论文部分内容阅读
自第一个使用鸟枪法成功地完成流感嗜血杆菌完整的基因组测序以来,基因组被完全测序的物种数量每年都在飞速增长。当两个非常相近物种的完整基因组可以获得的时候,首要的问题是如何比较和注释这些基因组。对此,传统的序列比对算法已不能胜任这一工作。因此,人们提出了许多新的用于比对基因组规模序列的方法。MUMmer是最重要的用于比对整基因组序列的系统之一,它所采用的基于锚的方法以及使用后缀树查找潜在锚的算法被越来越多的基因组规模比对程序所采用。因此,在本文的开始,首先对整基因组比对系统MUMmer的算法、整体结构和系统的演化进行了分析,这为系统的改进以及提出新的基于锚的基因组规模的序列比对方法提供了参考依据。由于可获得的计算资源的限制以及所要处理序列数据规模的日益增长,尽管后缀树的构造以及查找最大唯一匹配(MUM)算法的时间和空间复杂度都是线性的,但其空间花费依然是个很大的问题。鉴于此,本文决定使用加强的后缀数组来替代后缀树查找两基因组间的MUM。本文实现了两个基于加强的后缀数组查找MUM的算法,它们分别基于加强的后缀数组的性质和对后缀树的工作方式的模拟,与对应的基于后缀树的方法具有相同的时间复杂度,实验表明它们比相应的基于后缀树的方法有更大的空间节省。此外,在使用加强的后缀数组模拟后缀树的流匹配算法的过程中,提出了一个新的为后缀数组添加后缀链的线性算法,并证明了算法的正确性。
其他文献
云环境下分布式虚拟系统的老化现象是指一个在主机上长时间持续运行的VMM、虚拟机以及应用程序会发生状态退化和性能降低,最终导致虚拟系统的失效,并中断大量服务,从而造成重
在电信领域,随着中国电信业的逐步开放,电信业务支撑系统(以下简称电信BSS),也必须适应新的“面向客户”的经营模式的需要,在营销计划、开发、客户服务、质量保障、计费模式等等
由于细分方法不受控制网格拓扑的限制,可以对任意拓扑网格进行曲面造型,而且其递归结构与小波和多分辨率分析有着密切联系。又因为计算机图形学、计算机动画等领域对任意拓扑结
结构化P2P网络架构因不支持关键字查询而无法适用于应用最普遍的P2P文件共享系统,而在当前的文件共享系统中得到广泛应用的非结构化P2P网络架构也有着难以大规模化,网络负荷
基于事例推理(Case-Based Reasoning,CBR)作为基于知识的专家系统(Expert System)的一个分支,它是目前人工智能(Anificial Intelligence)研究中一种正在迅速发展的推理方法。
随着Internet技术的迅速崛起和在全球范围内应用的飞速发展,信息共享已经成为一种必然的要求,地理信息也不例外。集成分布式的、异构的信息一直是数据库领域的一个活跃的研究方
回转窑是氧化铝生产的重要设备,回转窑烧成带温度是保证熟料质量的关键因素,设计具有良好拟合效果的烧成带温度检测方法对提高氧化铝生产效率有重要的意义。 本文以中国铝业
随着计算机网络的不断飞速发展,网络信息量也随之急剧增加,从而造成了网络负载繁重、信息交互速度延缓、通信质量变差等各种问题的出现,这就迫切需要设计一个高效、稳定、灵
随着数字技术和因特网的发展,各种形式的多媒体数字作品(图像、视频、音频)纷纷在网络上传输或发表。数字作品的便利性和不安全性是并存的,它可以低成本、高速度地被复制和传播
软件开发是一种艺术、工艺、科学和工程。人们在设想、确定以及创建软件时,身边的环境不断在变更。敏捷是为了在动荡的业务环境中获益而创造变革和响应变革的能力。本论文主要