公共邻接距离基因组片段填充问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:yizeswing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着基因测序技术的发展,人们能够获得越来越多生物体的基因组,然而这些基因组并不完整。不完整的基因组被称为基因组框架。在很多计算生物学研究领域,无法直接使用基因组框架进行科学研究,可行的方法是将其补充完整再投入应用,基因组片段填充问题由此产生,并逐渐成为计算生物学的一个热门研究领域。片段填充问题通过参照相近物种的基因组来填充基因组框架,目的是使基因组框架变得完整并尽量接近原始的基因组信息。根据参照基因组的完整与否,片段填充问题又细分为单面填充和双面填充。在本文中,用一个字符表示一个基因家族,用字符串表示基因组。当基因组中不包含重复出现的基因时,片段填充问题在断点距离或DCJ距离下都是多项式时间可解的;当基因组包含重复出现的基因时,片段填充问题在断点距离或公共邻接距离下都是NP-完全的。目前主要的研究都集中在一般情况下的包含重复基因的基因组片段填充问题上,即允许在基因组框架的同一个位置上连续填充任意多个基因。但是在实际的基因组填充计算中,在同一个位置连续填充多个基因的情况并不多见,往往是在一个位置上填充1或2个基因,因此本文考虑下面的问题:在包含重复基因的基因组片段填充问题中,以公共邻接数目作为基因组之间距离的度量,以最大化公共邻接数为目的,如果填充长度为l的字符串到基因组框架的同一位置使得公共邻接数增加l+1,则l的取值仅为1或2。本文将该问题简称为SF-MNCA(2)(Scaffold Filling to Maximize the Number of Common Adjacencies)。文中对SF-MNCA(2)(?)司题进行了研究讨论。本文的主要贡献如下:(1)证明了SF-MNCA(2)是NP-完全问题。本文采用NP-完全性的理论证明方法,通过理论分析,找到适合用于归约的已知NP-完全问题:3DM,通过将3DM问题在多项式时间内归约为单面SF-MNCA(2)(?)司题,首次证明了单面SF-MNCA(2)是NP-完全的。(2)为单面SF-MNCA问题设计了简单的2-近似算法。本文给出了该算法的流程和详细的正确性证明,为后续算法的设计奠定了理论依据,具有很高的理论意义。(3)为单面SF-MNCA(2)(?)问题设计了6/5+ε-近似算法。本文在单面SF-MNCA的2-近似算法的基础上,采用局部搜索技术设计单面SF-MNCA(2)(?)问题的6/5+ε-近似算法,给出了算法流程、时间复杂度的分析和近似性能比的证明。
其他文献
P2P网络即为对等网络,是近年来日益流行的一种网络结构。随着P2P技术的飞速发展,它在给我们带来巨大机遇的同时也带来不少的挑战。P2P网络中各个节点的地位平等,没有服务提供
无线传感网络是由大量集成有传感器,数据处理单元,通信单元的微型传感器节点构成,这些节点通常造价低,计算能力和存储能力有限,能量有限。用于物理环境中进行事件检测是传感器网络
随着经济的快速发展,我国汽车数量急剧上升,给城市道路交通管理带来了巨大的压力,而传统的人工管理方式费时费力效率较低而且出现误判的概率较大,使得智能交通(ITS)得到迅速发展
Mashup服务是一种崭新的Web应用,以其易于开发、易于组合、高质量、个性化等优点成为了服务组合的发展方向,是实现SOA(Service-Oriented Architecture)和SOC(Service-Oriente
蛋白质交互(Protein-Protein Interaction,PPI)网络是生物体内蛋白质之间相互作用形成的网络,在拓扑结构上呈现小世界特性和无尺度特性,属于复杂网络的一种。近年来,随着高通
在进行动态物体融合时常常面临跟踪问题,传统增强现实中的摄像机定标、三维重建等技术在解决这一问题时往往计算成本过高,且计算所需的真世界信息也很难满足。视觉领域的目标
大家的学习和工作因为互联网的飞快发展给带来了极大的方便,同时也带来诸如盗版、信息篡改等一系列潜在的信息安全问题。为了解决该问题,传统的方法采用加密和数字签名等技术
移动健康监测作为新生事物,能够在医疗资源相对有限的社会环境里及时而有效地向用户提供价格低廉的医疗保健服务。生命信息处理已经成为一个崭新的尖端综合性研究领域。开发和
随着3G时代的到来,3G无线通信网络及相关技术的日臻成熟,一方面各类面向富客户端的应用异军突起,炫酷新颖的移动增值服务不断推出,极大提升了用户的体验。另一方面,这些应用服务对
信息数据在现代生产和生活中越来越重要。数据仓库被大型企业及政府广泛用于存储和处理大规模数据。OLAP联机分析处理成为数据仓库处理数据的一种有力工具。OLAP技术能够对数