论文部分内容阅读
微生物以群落的形式广泛存在于自然界中。群落的组成决定其生物功能。以454焦磷酸测序为代表的新一代测序技术凭借低成本、高通量、流程自动化的优势为研究微生物群落结构提供了新的技术平台。然而,如何更好地利用454测序并进行后续的数据分析一直是广受关注的问题。本研究从以下三个方面进行了探究。首先在本实验室获取的真实数据基础上,模拟了分别由16S rRNA V1-V2, V3和V6区获取的454片段组成的菌群结构信息,并与16S rRNA全长序列获得的群落结构进行比较。结果显示,这些可变区均能获得与全长序列相当的群落结构,但V6区反映的微生物多样性过高,和全长序列在属的水平上相关性较低。接着,在对现行454数据分析方法整合和改进的基础上,建立了一套包含序列质量控制、序列比对、距离矩阵计算、操作分类单元划分、多样性分析、分类地位鉴定和系统进化分析等步骤的分析流程。用该流程对真实的454测序数据进行分析,得到了和16S rRNA全长序列相吻合的结果。同时发现,样本平均测序量为800条时,各个分类水平上占主导的分类类型(>=5%)表现出良好的可重复性,但低丰度的细菌(<5%)在科和属的水平上的重复性和可靠性不佳。最后,将我们的分析流程和现行的454分析方法,如CVTree和BLAST-based方法进行比较,结果显示我们的分析流程获得的菌群结构和样本关系与16S rRNA全长的结果更为相近。