论文部分内容阅读
乳酸乳球菌乳酸亚种(Lactococcus lactissubsp.lactis,L.lactissubsp.lactis)是乳球菌属的模式种,既是自然发酵乳中常见乳酸菌,也是生产奶酪和低温发酵乳等发酵乳制品常用的发酵剂菌种之一。L.lactis subsp.lactis具有广泛的应用前景和较高的经济价值。系统解析L.lactis subsp.lactis的遗传背景、进化历程和功能特征对开发利用L.lactis subsp.lactis有着极为重要的意义。但从群体基因组水平解析L.lactis subsp.lactis遗传背景和功能特征的研究鲜有报道。本研究采用Illumina Hiseq高通量测序平台完成了 227株分离自自然发酵乳制品中的L.lactis subsp.lactis基因组重测序技术,结合NCBI已公布的89株全基因组序列,利用群体遗传学手段解析了L.lactis subsp.lactis群体的遗传背景、系统发育关系和种群结构,揭示了不同遗传谱系菌株的功能特征,利用全基因关联分析(genome-wide association analysis,GWAS)在基因组中对与关键表型相关的基因和位点进行了定位。主要研究结果如下:(1)完成了 227株L..lactis subsp.lactis基因组草图的绘制,从全基因组水平对L.lactis subsp.lactis的遗传多样性进行分析,结合ANI值和TNI值,阐明L.lactis subsp.lactis遗传多样性极其丰富,高于传统细菌分类学定义中的亚种水平。(2)以L.lactis subsp.lactis IL1403为参考序列对单核苷酸多态性进行分析,共鉴定78,624个SNP位点和4,517个InDel。在全基因水平对群体的进化推动力进行了分析,整个重组带来的SNP多于突变,有效种群大,且受到较强的纯化选择压力。(3)结合NCBI已公布89株基因组数据,构建了 435个核心基因和18,719个泛基因集。深入的系统发育分析和群体结构分析发现,L.lactis subsp.lactis群体可以划分为四个分支,其中包含一个环境谱系和三个驯化谱系。四个谱系之间存在至少两个以上的独立的驯化事件。环境谱系菌株先出现驯化谱系后出现,且环境谱系菌株为整个群体遗传多样性的提供者。(4)功能基因组学研究发现,不同遗传谱系菌株之间在碳水化合物活性酶、冷热应激蛋白等功能基因拷贝数上存在显著差异,且这些差异大多是由插入序列及质粒等可移动遗传元件导致。结果表明,可移动遗传元件可能帮助不同谱系的菌株适应环境。(5)不同驯化谱系菌株之间,发酵能力存在差异。通过GWAS将菌株基因组与发酵表型数据进行关联,定位影响关键表型的基因位点。GWAS共定位到76个位点和152个基因与34个表型存在关联,关联的基因主要集中于蛋白水解酶pepF、pepO、寡肽转运酶oppC、oppD和竞争蛋白CoiA五个基因上。上述基因可能影响菌株的生长,故影响大多数表型。基于上述位点构建随机森林模型以区分菌株发酵速度快慢,模型准确度AUC高达82.19%。本研究从基因组水平,基于群体遗传学和功能基因组学方法解析L.lactis subsp.lactis群体遗传背景和功能特征,定位影响表型差异的关键功能基因位点,为优良生产特性菌株的挖掘提供科学的指导,具有重要的实际生产意义。