论文部分内容阅读
耐多药(multi-drug resistant,MDR)病原体的传播和新的感染性病原体的出现导致全球传染病死亡人数逐年增加,肿瘤治疗出现多重耐药性,肿瘤患者数量不断增加,这些都已成为全球性的世界公共卫生问题。因此,迫切需要寻找抗感染和抗肿瘤的新型药物。来自细菌的活性天然产物(natural products,NPs)(多是次级代谢产物)及其衍生物具有结构多样性和广泛的药理活性,是药物发现的重要来源。然而,发现、分离和表征化合物的高重复性、低产量、长周期和高成本使得传统方法不再适用,并阻碍了新化合物的发现。所以需要更多潜在的生物技术来寻找新的活性天然产物。细菌基因组测序显示它们产生天然产物的潜能远超过之前预测。基于公共数据库中已经积累大量基因组序列数据,基因组学分析方法可用于挖掘活性天然产物生物合成的基因簇(biosynthetic gene cluster,BGC),能够发现未知的“神秘”代谢产物和潜在的治疗候选药物。挖掘和优选这些天然产物生物合成基因簇是新化合物发现的第一步也是最重要阶段。因此,为了更好地研究细菌这些次级代谢产物生物合成潜力的多样性,本研究选择三个属的细菌基因组序列,通过组合不同的基因组学分析方法构建了系统化的分析框架,并将其应用于识别和优选潜在的基因簇(BGC),并进行比较基因组学分析和新天然产物的结构预测。(1)基于rpoB进化树分析三类细菌天然产物生物合成基因簇的系统进化,考察基因簇在种水平和亚种水平上的分布及多样性首先,选择了公共数据库(NCBI)中可用的革兰氏阳性链霉菌(62个参考基因组序列)、革兰氏阴性伯克霍尔德菌(248个基因组序列)和假单胞菌(37个参考基因组序列)的基因组数据,来研究活性天然产物生物合成的基因簇(BGC)。在以往文献中,这三个属是报道最多的活性天然产物的产生菌(粘细菌也是重要一类产生菌,但公共数据库中粘细菌基因组序列相对太少)。利用antiSMASH、BAGEL、PRISM等多个生信分析工具对这些基因组序列进行分析预测,发现每个属中这些基因组合计分别含有1868个(链霉菌属)、363个(假单胞菌属)和4729个(伯克霍尔德菌属)生物合成基因簇(BGC),与次级代谢物的生物合成有关。然后,为了比较BGC的丰度和类型,本研究构建了基于rpoB的物种间(属内)甚至亚种间(种内)进化树,发现这些菌株在进化树中分属于9个(链霉菌属)、14个(假单胞菌属)和7个(伯克霍尔德菌属)亚簇。结合rpoB进化树分析这些细菌的生物合成基因簇(BGC),研究发现:不同物种(属内)之间BGC的分布丰度和类型存在非常高的多样性,甚至不同亚种之间(种内)的BGC分布和类型差异也很大。这些分析结果说明作为一种替代方法,在细菌的亚种水平上也有可能获得更多细菌的次生代谢产物。同时发现,在所有物种中(不同生境不同种属)存在许多“常见类型的BGC”,说明这些BGC在进化上发生了广泛的横向基因转移;这些BGC的存在可能与这些菌株适应不同生境的能力有关。总之,本研究对链霉菌属、伯克霍尔德菌属和假单胞菌属的生物合成多样性进行系统化地比较与分析。结果表明,由于其基因组中存在大量功能待定的基因簇,这三类细菌依然具有发现活性化合物的巨大潜力。(2)在全基因组水平上分析细菌生物合成基因簇的分布与物种相关性以及天然产物合成菌的优选本研究在全基因组水平上利用比较基因组学分析三个菌属的BGCs的多样性、分布和进化情况。研究发现:这三个属中每个基因组中BGC总数量存在较大差异。与伯克霍尔德菌(BGC平均数量/数量范围:19/7-26)和假单胞菌(10/6-16)相比,单个链霉菌基因组具有更多的BGC分布,平均数量为30个,分布数量范围为19-48个。比较分析观察到:“最常见的BGC类型”存在一定属间差异:链霉菌中最常见的BGC是萜、铁载体、非核糖体肽的基因簇和杂合的基因簇,伯克霍尔德菌中是萜、非核糖体肽、类-翻译后修饰肽、hserolactone和类-非核糖体肽的基因簇;假单胞菌中更多是非核糖体肽、氧化还原辅因子、类-翻译后修饰肽、芳基多烯、β-内酯、类-非核糖体肽以及ranthipeptide的基因簇。很多类型BGC在同一基因组中呈现多拷贝分布。针对“特定类型的化合物的BGC”,三类菌也表现出明显的属间差异。以细菌素类基因簇为例,在伯克霍尔德菌中最普遍的BGCs对应产物是capistruin和linocinM18细菌素,链霉菌中是ZoocinA、LAPS和Ⅱ型羊毛硫肽等细菌素;而假单胞菌中则是Ⅲ类细菌素(>10kD)。用三种方法研究伯克霍尔德菌的系统发育,发现这个属的近两百株菌明显位于三个更古老的进化分支上;类-核糖体合成翻译后修饰肽(RiPP-like)的BGC核心基因的系统发育显示它们具有较高的进化多样性;此外,使用NaPDoS软件从基因组水平上搜索了非核糖体肽合成酶和聚酮合酶的核心结构域,显示它们具有高丰度分布。除了利用比较基因组学来探讨细菌之间的全基因组相关性外,还在属内可识别的BGC之间建立了基因簇家族(gene cluster family,GCF)网络,用以分析和评估与已知BGC的相关性和进化。(3)分离新的链霉菌和伯克霍尔德菌并进行基因组学分析和活性天然产物分离和结构解析从未开发的湖南常德市陬市镇铁丝岗山地土壤样本中分离出一组细菌,从中获得了两种菌株,包括对多个病原体具有强效抑制活性的Streptomyces sp.CS-7以及生长速度较快的Burkholderia sp.S-53。基因组分析显示,Streptomyces sp.CS-7有36个天然产物基因簇,其中大部分是未知的,具有合成未知结构化合物的巨大潜力;未发现Burkholderia sp.S-53在目前实验室条件下合成抗菌活性天然产物。然而,基因组测序显示,Burkholderia sp.S-53基因组上有7个未知的天然产物基因簇,推断它具有产生新化合物的潜力;并基于单基因和全基因组序列对两株菌进行了分子水平上的菌株鉴定。在优化培养基的基础上,从Streptomyces sp.CS-7菌株发酵液中纯化出两种具有抗金黄色葡萄球菌的重要的化合物玛雅霉素B和玛雅霉素。(4)结论天然产物生物合成基因簇的识别和优选对于天然产物的挖掘非常重要。基因组挖掘技术的发展使天然产物的研究更加精细化,开启了药物发现的第二个黄金时代。研究物种之间及亚种之间的系统发育、物种间的比较基因组学和全基因组相关性,对于了解物种间的BGC的多样性及系统进化十分重要,可以揭示不同物种的BGC在分布丰度和种类上的多样性。首先,在更大基因组样本分析基础上研究发现:(ⅰ)三个属的所有细菌物种都有很多未知天然产物生物合成基因簇(BGC),其中很多与已知BGC的相似性非常低;(ⅱ)与伯克霍尔德菌属和假单胞菌属相比,链霉菌属的细菌具有更多数量的BGC,说明链霉菌依然具有更大的潜力产生新化合物;(ⅲ)天然产物生物合成基因簇的多样性因物种而异,系统发育接近的物种具有最相似的BGC分布,但在亚种水平上还是发现BGC的变异;(ⅳ)特定的主要化合物类群(例如翻译后修饰肽RiPP细菌素)的BGC在不同属中呈现多样性差异;(ⅴ)建立了属内BGC家族网络用以显示BGC进化距离;(ⅵ)观察到伯克霍尔德菌中类-RiPP的BGC的进化多样性,以及整个基因组水平上的非核糖体肽合成酶和聚酮合酶核心结构域的高丰度分布。其次,(ⅰ)从未充分开发的栖息地分离出两株菌分别属于链霉菌和伯*霍尔德菌(CS-7和S-53),并从CS-7中鉴定出两种重要的中物活性化合物;(ⅱ)在单基因和全基因组水平上通过使用不同的方法对CS-7和S-53进行了细菌分子水平上的鉴定;(ⅲ)在两个菌株(CS-7和S-53)中发现了 BGC的分布的多样性并进行相关化合物的结构预测。总之,针对天然产物生物合成基因簇BGC,开展了比较基因组学分析,建立物种进化联系,对BGC在全基因组水平上的多样性进行分析,这些研究对于识别和优选特定BGC并用于药物开发具有重要意义。使用多种基因组挖掘工具可以预测更多未知的BGC,并可以预测相关化合物的结构以及与物种进化的相关性,用以指导将来天然产物的鉴定。尽管之前天然产物的功能鉴定已经有广泛的研究报道,但本研究基因组水平上的比较分析结果显示细菌具有更广泛而独特的天然产物生物合成潜力,这表明它们仍然是活性物质的重要来源。