论文部分内容阅读
随机突变与高通量筛选相结合是挖掘与表型相关的遗传元件和潜在调控机制的有力工具。尽管存在许多用于使核酸序列多样化的突变策略,但由传统物理或化学诱变产生的随机突变通常需要大量的分析才能确定关键突变。基于CRISPR的文库筛选可以相对快速地识别突变,然而,设计高效的向导RNA文库仍然具有挑战性,而无活性的向导RNAs通常会降低全基因组的覆盖率,产生假阴性。插入突变是一种构建突变文库的便捷方法。在基因组中插入特定的序列不仅能造成基因失活或影响基因表达,而且插入片段还可以作为选择标记或插入位点鉴定的标签,通过它识别插入位点,从而有助于快速定位关键突变。如转座子介导的插入突变已被开发用于许多微生物的突变文库构建,成为大规模分析基因功能的有力工具。然而,一些微生物没有合适的内源转座子,因此必须引入异源转座子系统进行突变,该方法的突变效率很大程度上取决于转座效率。因此迫切需要开发新的可快速追踪关键突变的方法。解脂耶氏酵母(Yarrowialipolytica)是一种非常规产油酵母,因独特的生理和代谢特性使其成为生产基于脂质的化学品、有机酸、黄酮和萜类等化合物的优良底盘。与模式酵母酿酒酵母(Saccharomyces cerevisiae)不同,解脂耶氏酵母表现出对非同源末端连接(Non-homologous End Joining,NHEJ)修复DNA双链断裂(Double-Strand Breaks,DSBs)的强烈偏好。内源性DSBs在许多生物过程中产生,并广泛分布于整个基因组中。在NHEJ介导的DSBs修复过程中,无需同源DNA序列作为模板,游离DNA可插入到连接处。因此,外源DNA的插入为产生插入突变提供了可能性。本论文以解脂耶氏酵母中NHEJ介导的基因组整合为基础,首先绘制了NHEJ介导的基因组整合的位点分布图谱,位置特征分析表明,其随机分布和高覆盖率的特性满足全基因组尺度突变的要求。通过简单的转化含有筛选标记的DNA片段,即可构建突变文库。基于该方法,我们分别构建了不同类型的突变文库并进行了应用。其中通过构建NHEJ介导的随机插入突变文库成功鉴定了提高乙酸耐受性和β-胡萝卜素生物合成的新靶点;在此基础上,对文库构建策略进一步优化,插入片段除了筛选标记也引入强启动子UT8(UAS1B8-TEF1 Promoter,UT8),可构建基因激活文库,并利用该文库构建策略鉴定了激活解脂耶氏酵母木糖代谢的靶点;随后通过构建NHEJ介导的GFP(Green Fluorescent Protein,GFP)随机表达文库,鉴定高表达的基因组整合位点,基于此开发了 CRISPR基因表达工具包。1.解脂耶氏酵母中NHEJ介导的基因组整合的位置特征分析我们首先利用解脂耶氏酵母对NHEJ修复DSBs的强烈偏好,实现了外源DNA片段(LEU2表达盒)的高效转化和基因组整合,构建完成了一百万单克隆容量的NHEJ介导的突变文库。然后采用酶切连接介导的分子内环化方法以及高通量测序来确定整合位置,从而首次绘制了 NHEJ介导的基因组整合的分布图谱。通过对9.15×105个整合位点的分析表明,NHEJ介导的整合在染色体上随机分布,且整合频率很高。转录调控区域表现出相对整合偏好,特别是在转录起始位点(Transcription Start Site,TSS)附近。对整合位点侧翼序列的分析,没有发现序列特异性偏倚。此外,利用ATAC-seq技术首次实现了解脂耶氏酵母基因组中核小体占据区域(Nucleosome-Occupancy Regions,NORs)和无核小体区域(Nucleosome-Free Regions,NFRs)的定位。通过进一步分析NHEJ介导的整合与核小体占位的关系,结果显示整合位点在核小体占据区域和无核小体区域均有分布。NHEJ介导的基因组整合的分布图谱展示了整合位点随机分布和高覆盖率的特征,满足全基因组尺度突变的要求。2.构建NHEJ介导的随机插入突变文库鉴定提高乙酸耐受性和β-胡萝卜素生物合成的靶点我们利用NHEJ介导的整合构建了可追踪的随机插入突变文库,并以提高乙酸耐受性和β-胡萝卜素生物合成为例,实现了关键靶点的快速筛选。在乙酸胁迫耐受性的研究中,筛选到了转录激活因子YALI1B10891g(酿酒酵母Haa1的同源蛋白),参与弱酸胁迫的调控。还筛选到应激性转录激活因子YALI1B28150g(Msn2)和泛素特异性蛋白酶YALI1D04469g(Ubp2)。插入靶点均位于基因编码区上游,表明外源DNA片段的插入通过影响靶基因的表达从而提高乙酸耐受性。在β-胡萝卜素生物合成的案例中,筛选到了四个关键靶点:包括RabGGTase(YALI1F09177g),减数分裂转录因子Ndt80(YALI1B19390g),富含组氨酸的蛋白质(YALI1B07915g)和一种功能未知的蛋白质(YALI1B10170g)。其中有的靶点位于基因内部,有的位于基因编码区上游,如RabGGTase,是Rab Escort蛋白,其编码基因为必需基因,插入发生在启动子区域。香叶基香叶基焦磷酸(GGPP)是β-胡萝卜素合成的直接前体。通过转录分析推测该突变体通过下调YALI1F09177g的转录来减少前体GGPP的消耗,从而促进β-胡萝卜素的产生。而转录因子Ndt80的缺失使β-胡萝卜素的产生提高了 62%。该突变体一方面通过下调麦角甾醇的合成来调控β-胡萝卜素的积累,另一方面增加脂质生成以促进β-胡萝卜素的储存。本论文首次发现该转录因子对于萜类化合物合成的重要作用。此外,基因间和基因内靶点的鉴定,证明了 NHEJ介导的突变文库在基因破坏和基因表达调控方面的能力,特别是当鉴定必需基因或需要适度表达的基因时,是对经典方法的一个有力补充。3.构建NHEJ介导的基因调控文库鉴定激活解脂耶氏酵母木糖代谢的靶点NHEJ介导的整合在转录调控区域特别是启动子区域的偏好性使其具备了构建基因调控文库的能力。为测试该方法能否构建基因表达激活文库,我们将强杂合启动子UT8插入到解脂耶氏酵母内源启动子的不同位置,发现可以实现表达的激活。因此利用NHEJ介导的整合构建了随机插入文库实现一步构建基因失活和调控文库,并成功鉴定了与激活解脂耶氏酵母木糖代谢相关的靶基因YALI1C28456g。反向工程验证表明YALI1C28456g的开放阅读框(Open Reading Frame,ORF)注释存在错误,重新确定开放阅读框后,证实UT8片段在靶基因YALI1C28456g转录调控区的插入激活了该基因的表达,从而实现了突变菌株在木糖上的生长。通过序列相似性比对、跨膜结构域预测、亚细胞定位以及RT-qPCR转录水平测定,表明YALI1C28456g为解脂耶氏酵母的木糖转运蛋白。为了验证其对五碳糖是否都具有转运能力,我们也测试了该突变对菌株在阿拉伯糖中生长的影响,发现YALI1C28456g的过表达也可增强阿拉伯糖的代谢,证明其对戊糖的代谢均具有促进作用。4.构建NHEJ介导的GFP随机表达文库开发基于CRISPR的基因表达工具包在前期研究中,我们发现外源基因的整合因基因组整合位置不同而导致表达差异。于是我们利用NHEJ介导的整合构建了 GFP随机表达文库,并借助荧光激活细胞分选(Fluorescence-Activated Cell Sorting,FACS)技术鉴定了高表达的潜在整合位点。通过对这些整合位点在不同条件下表达稳定性的表征以及CRISPR-Cas9介导的整合效率的测定,我们获得了高表达和高整合效率的中性整合位点。此外,也对不同表达控制元件进行了表征,共表征了 18个启动子和12个终止子,从而扩展了 CRISPR工具包的表达范围。利用这些遗传元件和整合位点来组合调控番茄红素生物合成途径中的基因,实现了不同水平的番茄红素合成。综上所述,本论文系统地解析了 NHEJ介导的基因组整合的位置分布特征,并开发了 NHEJ介导的基因组插入文库构建技术,经优化该技术可实现基因的失活和激活或抑制调控,利用该文库构建策略,鉴定了影响酸耐受性、β-胡萝卜素合成和木糖代谢的关键基因,说明该文库构建策略在挖掘与简单表型相关的遗传元件中的应用潜力。此外,我们利用该技术构建了 GFP随机表达文库,鉴定了高表达、高整合效率的CRISPR整合位点,并构建CRISPR表达调控工具包。这些技术与工具包的开发,有力的拓展了解脂耶氏酵母的分子生物学工具,对该酵母的机理研究和代谢工程研究均具有重要意义。