论文部分内容阅读
微生物个体微小(直径小于0.1毫米),构造简单,包括细菌、放线菌、原生动物、藻类和原虫等,与人类日常生活、健康密切相关。微基因组作为遗传信息的携带者,是我们破译微生物生物学性状的核心密码。进行微生物基因组研究,对于了解微生物遗传机制、代谢过程以及一些微生物特殊功能如耐药性、致病性的遗传基础具有重要意义。作为微生物基因组学研究的基础,获得微生物全基因组序列显得重中之重。随着高通量测序技术的突飞猛进,测序通量大大提高,测序时间和成本不断降低,微生物全基因组测序也在飞速发展。然而,高通量测序的短读长又给全序的组装带来了新的困难。当前主流的高通量测序平台有三种:罗氏454公司的GS FLX+、Illumina公司的Hiseq及Miseq、Life公司的Ion Torrent。其中Ion Torrent高通量测序平台具有测序速度最快,操作简单、灵活和低成本等优点,是中等规模测序最佳选择,非常适合微生物这类小基因组的全基因组测序。本文以Ion Torrent平台测序数据为基础,全面探索了微生物全基因序列的组装过程以及遇到问题,并提出了相应的解决方法。全基因组序列组装类似于搭积木、玩魔方,简而言之,就是将零散的测序片段还原成完整的基因组序列的过程。基于Ion Torrent平台测序数据的特点,我们在组装算法和组装软件进行了选择,选择了基于OLC算法罗氏454公司推出的商业组装软件Newbler。而后在进行后续的基因组完成图时,我们又针对微生物基因组组装特点,选取了三种基因组组装辅助工具。其中ContigScape用来展示微生物基因组组装过程中由重复序列造成的contig之间的复杂关系,使得我们可以快速熟悉基因组结构的基本信息;基因组光学图谱用于指导序列组装,显著增加微生物基因组序列拼装质量,并对组装结果矫正分析;GapFiller用于补基因组内部的gap。综合以上的方法,我们建立了基于Ion Torrent平台测序数据微生物全基因组序列组装方法,其中也编写了很多个性化的程序用于简化流程,希望对没有基因组组装经验的科研人员有所帮助。此外,针对基因组序列组装中的重复序列问题,我们还建立的实时定量PCR法,通过简单的设计引物,PCR扩增,观察CT值就可以直接判断出contig位置关系,更省时间、精力,更重要的是节约成本,对二代测序数据组装,尤其是微生物基因组序列组装,有很大的意义。最后,我们也以COG注释、不同菌株基因含量比较、毒力基因的查找为例,简要的介绍了微生物基因组个性化的后续分析方法。综上,本文在现有方法基础上,利用Ion Torren测序平台数据,进一步完善了微生物基因组序列组装流程,提出了更加简单、快捷的方法来解决组装过程中遇到的重复序列问题,也对全基因组序列进行了一些后续分析,简化了分析流程。文中提到的方法,均有实例对应。然而,针对不同的研究对象和要求,研究者仍需要具体问题具体分析。希望本文能够给其他科研人员以参考。