论文部分内容阅读
基因组编辑技术是我们了解并改造微生物的重要技术手段,同时也是现代生物技术领域研究的热点。传统的微生物基因敲除技术需要通过同源双交换及正反两次筛选才能获得最终的敲除菌株;后来随着高效噬菌体重组酶(bacteriophagerecombinase)的发现,通过一次同源重组(Homologous Recombination,HR)就能够实现DNA片段的同源替换,大大提高了基因敲除的效率,但重组过程仍需要借助选择性标记基因筛选突变体并且会在基因组上留下敲除“疤痕”;近年来发展起来的CRISPR-Cas(Clustered Regularly Interspaced Short Palindromic Repeat/CRISPR-associated)基因编辑技术弥补了上述方法的不足,实现了基因组的高效无痕编辑,被迅速应用于各种微生物的基因改造,掀起了基因编辑领域的革命性狂潮。CRISPR-Cas系统是一种广泛存在于细菌及古生菌中的获得性免疫系统,通过一小段crRNA序列以碱基互补配对的方式指导Cas效应蛋白靶向特定的DNA或者RNA并进行切割,从而达到抵御外来遗传物质入侵的效果。基于上述分子机制,通过人工设计crRNA能够指导Cas效应蛋白靶向基因组上特定的DNA序列并切割形成DNA双链断裂(Double-Strand Break,DSB),在DSB修复的过程中实现对于基因组的改造,由此便开发出了基于CRISPR-Cas系统的高效基因编辑技术。DSB主要是通过非同源末端连接(Non-Homologous End Joining,NHEJ)及HR两种方式进行修复。NHEJ通过直接连接DNA断裂末端实现DSB的快速修复,可以在不同细胞周期中发挥作用,是真核细胞修复DSB的主要方式。在DSB连接过程中往往需要对断裂的DNA末端进行加工修饰,导致最终的DNA连接接头可能出现几个碱基的插入或者缺失(indel),造成基因的突变。因此,通过易错的NHEJ途径修复DSB并制造indel成为了真核细胞中最简便的基因失活手段。另外,DSB也可以通过HR进行精确修复,该过程需要一个带有同源序列的DNA修复模板,在重组酶的作用下与靶向的DNA区域发生同源交换完成DSB的修复,实现精确的基因编辑。在原核生物中,由于NHEJ修复机制研究相对匮乏,CRISPR-Cas系统主要通过结合HR进行基因编辑。在此过程中,编辑不同基因除了构建CRISPR位点外,还需要构建相应的DNA修复模板,严重限制了 CRISPR-Cas系统在多基因,尤其是高通量基因编辑中的应用。而近年来随着功能基因组学及DNA合成技术的发展,高通量基因编辑展现出了巨大的应用前景,通过在基因组水平波动基因的表达,结合基因组、转录组、蛋白组及代谢组等组学分析手段,可以更加高效地进行基因功能分析、代谢流量优化及微生物细胞工厂的构建。本论文旨在分析原核微生物NHEJ途径的基础上,开发适应于细菌的高效基因编辑技术,进行基因组的高通量删减并探索该技术在微生物适应性进化研究中的应用。在本论文中,我们首先通过蛋白质结构域家族数据库Pfam及蛋白质综合数据库InterPro分析了 NHEJ系统中的典型组分Ku蛋白在原核生物中的分布情况。发现有9726种蛋白质具有典型的ProkKu结构域特征,主要分布于酸杆菌门(Acidobacteria)、拟杆菌门(Bacteroidetes)、疣微菌门(Verrucomicrobia)、变形菌门(Proteobacteria)及放线菌门(Actinobacteria),其中,放线菌门中的结核分枝杆菌(Mycobacterium tuberculosis)更是作为原核NHEJ系统的典型代表开展了许多深入的研究。在此基础上,我们重点关注了一类同样来源于放线菌纲并且能够耐受极强离子辐射的微生物,对其中的耐辐射动球菌(Kineococcus radiotolerans)进行了 NHEJ途径的分析鉴定,发现了 NHEJ系统特有的ATP依赖的DNA连接酶,说明很可能存在高效的NHEJ修复系统赋予其对于离子辐射的超强抵抗能力。通过电转化线性质粒片段实验,我们探索了两种不同来源的NHEJ系统在大肠杆菌中修复DSB的能力。异源NHEJ系统的表达都能够促进大肠杆菌对于DSB的修复,其中结核分枝杆菌来源的MTNHEJ系统在DSB修复的效率及保真性方面最具优势,将大肠杆菌胞内DSB的修复效率提高了十倍。同时,我们又分别对MTNHEJ系统中的Mt-Ku及Mt-LigD组分在DSB修复过程中发挥的作用进行了评估,发现两者的缺失都会显著影响DSB的修复效率,DSB修复的保真性也会有所下降,只有在Mt-Ku及Mt-LigD都存在的情况下MTNHEJ系统才能完全发挥DSB的修复能力。我们还总结了 DSB非保真修复过程中产生DNA突变的具体类型及特点,发现MTNHEJ系统在高效修复DSB的同时,会有50%左右的几率造成连接后的DSB末端出现不同长度DNA片段的缺失,进而导致基因的失活,这为我们后续开发基于NHEJ修复系统的原核基因编辑工具奠定了良好的基础。我们借鉴真核CRISPR-Cas9基因编辑策略,将CRISPR-Cas9介导的DSB与NHEJ引发的易错DSB修复结合起来,在大肠杆菌中开发了 一种新型的不依赖于DNA修复模板的基因突变技术(CRISPR-Cas9 assisted Non-Homologous End-Joining,CA-NHEJ),这在原核微生物基因编辑中属于首创。利用大肠杆菌半乳糖苷酶基因作为报告基因,我们对CA-NHEJ的效率及突变率进行了表征及优化。通过敲除recA避免胞内CRISPR阵列质粒发生HR及使用sgRNA表达CRISPR位点避免重复序列的出现,显著提高了 CA-NHEJ系统的基因突变效率。同时,不同sgRNA位点的基因突变实验表明,CA-NHEJ不存在sgRNA位点的偏好性,能够有效地对基因组中不同的基因进行删除突变。另外,我们通过同时表达两个sgRNA位点实现了基因组上DNA大片段的删除,展现了该方法在基因组删减方面的应用潜力。我们还尝试将CA-NHEJ系统应用于假单胞菌基因编辑,成功获得了pyrF及upp基因失活的突变体,证明了该系统在其他微生物中进行基因突变的应用前景。CA-NHEJ基因突变系统相对于传统的基于HR的基因敲除技术,具有操作简单、实验周期短、不需DNA修复模板及选择性筛选标记基因等优点,非常适合于高通量的基因删除。因此,我们对前期建立的CA-NHEJ系统进行了效率及突变率的改进,提出了 CA-NHEJ 2.0及CA-NHEJ 3.0基因突变系统。其中,CA-NHEJ 2.0系统通过使用严谨型四环素诱导启动子及Cas9-Cm融合蛋白表达策略,实现了可诱导的高效基因组DNA片段的定点删除。结合DNA芯片合成技术,我们在大肠杆菌中设计并合成了 1 1024个覆盖整个基因组的sgRNA位点,构建了 sgRNA表达文库并利用CA-NHEJ 2.0系统进行了基因组规模的高通量基因删除。通过高温培养条件对突变体库进行筛选分析,我们不但找到了细胞高温生长所必需的关键基因miaA,同时发现大肠杆菌基因组中的隐秘噬菌体CP4-6很可能与细胞在高温环境中生存有关。CA-NHEJ 3.0在CA-NHEJ 2.0系统的基础上将CA-NHEJ的所有组件整合至单个质粒上,经过启动子及复制子的优化,实现了单质粒的诱导型基因删减。并且通过引入基于sacB负筛选的质粒去除策略,高效去除完成基因组删减的细胞中的CA-NHEJ质粒,实现了快速的基因组迭代删减。最后,为克服高通量基因组删减过程中sgRNA文库无效质粒造成的干扰,我们利用SOS启动子pcda构建了一套SOS响应监测系统。通过流式细胞分析不同细胞的荧光蛋白表达强度,进行了细胞个体层面的基因组DSB监控,建立了一项全新的突变菌株筛选方法,为后续CA-NHEJ技术应用于微生物基因组的精简奠定了基础。综上,本论文提出的基于NHEJ的基因删减策略是原核微生物基因编辑工具的有力补充,有效地提高了大肠杆菌基因组删减的效率。同时,我们提出的基于CA-NHEJ的高通量基因突变策略能够在基因组规模上快速分析微生物基因型与表型间的对应关系,高效挖掘微生物代谢改造的潜在靶点,这对于功能基因组学研究及微生物细胞工厂的构建均具有重要的指导意义。最后,CA-NHEJ技术不需要任何DNA修复模板就能够完成基因组DNA大片段的删减,在基因组的进化及精简等方面也具有广阔的应用空间。