【摘 要】
:
进入二十一世纪以来,新一代测序技术的出现使得到全基因组的拼接组装算法备受关注。以Roche公司454,Illumina公司Solexa,ABI公司SOLiD为代表的新一代测序技术产生的数据存在
论文部分内容阅读
进入二十一世纪以来,新一代测序技术的出现使得到全基因组的拼接组装算法备受关注。以Roche公司454,Illumina公司Solexa,ABI公司SOLiD为代表的新一代测序技术产生的数据存在测序片段短、错误率高等缺点,使得传统的拼接组装软件不再适用。但是由于其高通量、低成本的优点,尤其在细菌等微生物从头测序中取得的成功极大的鼓舞了人们对新一代测序技术的研究热情。全基因组组装算法研究是全基因组拼接组装算法的一个重要环节,研究并开发可运行在个人计算机上的独立的组装算法是非常有必要的。面向新一代测序数据的全基因组拼接组装算法分为两个重要的部分,第一个部分是将新一代测序技术产生的DNA片段拼接成contig的过程,称之为拼接阶段。第二个部分是将拼接阶段产生的contigs组装成scaffold的过程,称之为组装阶段。本文所要研究的就是全基因组的从头测序组装阶段的算法,为达到这个目标,本文在研究新一代测序技术原理的基础上,提出了快速筛选配对信息的算法与contig组装算法。通过配对信息库的构造过程,得到了所有contig上面所存在的配对信息,设计了两个映射结构获得任意两条contig之间的关联关系,提出了独特的数据结构来保存任意两条contig之间的配对信息数目,最终完成了从头测序组装算法的设计与实现。提出了快速筛选有效配对信息的算法以及contig组装算法,该算法是可运行在个人计算机上的串行算法。设计了节省内存的数据结构,提高了算法的速度。充分利用了测序数据的生物学特征,在不考虑contig之间有重叠的情况下成功组装了72%的contig。
其他文献
国人自私心太重,公德心太弱,所见所谋,短小浅近。只顾跟前,忽视将来,只有个人,不知团体。其流弊所及,遂致民族思想缺乏,国家观念薄弱,良可慨也。
在边底水断块油藏开发过程中,边底水的侵入会导致生产井见水时间短、无水采油期短,见水后油井含水上升快、油井暴性水淹等生产问题,严重影响了油藏的开发效果。向边底水断块
我国环保辐射系统中使用的最多γ谱仪是高纯锗γ谱仪,本文主要介绍了高纯锗γ谱仪的组成、能量刻度、效率刻度操作和数据处理分析。
为提高蛋白酶与羊毛的作用效果,减少羊毛损伤和缩短酶处理时间,通过研究活化剂存在条件下蛋白酶的催化有效性及活化剂与羊毛的反应速率,验证了由蛋白酶和活化剂组成的生物酶
2000年以前,中国对外投资政策侧重“利用国外的资源、技术、市场以补充国内不足”,在一定程度上限制了中国对外直接投资的规模和数量。2000年以后,中国适应经济全球化新形势,实施
在大数据时代,特征选择在数据挖据和机器学习中占有不可或缺的地位。传统的特征选择分类算法是通过获得高分类精度来说明算法的有效性。然而,在现实中,数据样本的获取具有不
鲑鳟鱼是世界性的主养冷水鱼类,其肌肉富含人体必需的氨基酸、不饱和脂肪酸等,是优质的高端水产品,市场需求巨大。工厂化循环水养殖是实现鲑鳟鱼高密度、高品质、高产量的重
合浦珠母贝是海水养殖生产珍珠主要经济贝类,合浦珠母贝源活性肽是近年来的研究热点。本文综述了国内外近年来在合浦珠母贝源抗氧化肽的酶法制备技术、分离纯化技术、功能性
采用温挤压精密成形技术 ,成功地研制出直齿圆柱齿轮零件 ,实验证明 ,新工艺具有优质、高效、节材、节能的特点 ,非常适合直齿圆柱齿轮特别是大模数齿轮的精密成形 ,精巧的模
分别从中国、美国、德国、日本土壤污染防治法律法规体系入手,介绍了国外和我国土壤修复标准,并进行对比。结合我国的场地修复工作实际情况,认为从修复工程实施后的用地类型