论文部分内容阅读
CRISPR/Cas是最近在原核生物中发现的一种获得性免疫系统,广泛分布于细菌(~40%)和古菌(~90%)基因组中。该系统可以获取病毒、质粒等外源遗传因子的DNA序列信息(作为间隔序列即spacer存储于CRISPR结构中),并产生携带该序列信息的小分子RNA(CRISPR RNA),指导Cas蛋白特异地干扰外源DNA。关于CRISPR RNA的产生和靶DNA的干扰两个过程已经有大量的研究报道,而对于CRISPR适应外源遗传因子(即spacer获取)的过程,自从Barrangou等人(Science,(2007),315,1709-1712)第一次观察到spacer获取现象之后,长期以来鲜有相关报道。因此关于该过程有两个基本问题一直困扰着科学家们,一是spacer获取机器如何特异性识别外源DNA,并避免获取自身序列;二是在实验室构建的绝大多数宿主菌-病毒互作模型中为何难以观察到高效的适应现象。我们以极端嗜盐古菌的I-B型CRISPR系统为模型,通过大量的遗传学实验揭示了适应过程的异己区分机制——“PAM验证的引发机制”,从而回答了这两个基本问题。 首先,我们从环境样品中筛选了侵染Haloarcula hispanica的病毒HHPV-2,并构建了宿主-病毒互作模型。在该模型中,我们观察到了高效的CRISPR适应现象,HHPV-2的DNA片段被特异地获取并作为新的spacer插入到CRISPR结构中。通过构建大量cas突变株和CRISPR结构变异体,我们发现该过程不仅需要Cas1,Cas2和Cas4,而且需要参与CRISPR RNA加工和靶DNA干扰过程的Cascade和Cas3,以及一个与HHPV-2 DNA具有一定同源性的spacer序列(spacer13),暗示了该spacer引发适应过程的可能性。我们通过进一步分析发现在从HHPV-2基因组上获取新spacer的过程中,在引发spacer同源序列的上下游呈现出相反的链偏好性,说明了该引发spacer在适应过程中发挥了重要作用。该引发机制说明适应过程需要借助干扰机器,通过CRISPR RNA的指引实现异己区分。 然而值得注意的是,引发机制不仅能指引适应机器靶向携带某一spacer同源序列的外源DNA,还有可能将适应过程靶向宿主的spacer DNA本身。我们的研究进一步揭示了PAM(protospacer adjacent motif)序列在引发过程中的重要作用。在64种可能的PAM序列中,干扰过程特异地识别4种,而引发过程识别23种,说明这两个偶联的过程都需要验证PAM序列,但引发过程可以容忍该序列更多的变异。在spacer DNA的对应PAM位置上是其上游repeat的保守序列AGC,该序列在PAM验证过程中不能被识别,从而使spacer DNA免于干扰和引发适应。这就解释了引发适应过程如何应对逃逸干扰过程的PAM突变,同时又避免靶向自身的spacer DNA。 综上,我们在极端嗜盐古菌I-B型系统中的研究揭示了CRISPR适应过程的异己区分机制——“PAM验证的引发机制”。这不仅回答了困扰科学家多年的两个基本问题,也为在其它宿主-病毒模型中广泛开展适应过程的研究奠定了理论基础。另外,我们还以Haloferax mediterranei为模型,首次对I-B型系统中Cas6介导的CRISPR RNA加工过程进行了解析。有意思的是,我们意外发现了Cas6对某一原病毒mRNA的特异性切割,以及由此介导的对原病毒活性的抑制效应。这是关于Cas6蛋白加工非CRISPR RNA的第一例报道,暗示了存在其它非CRISPR RNA底物的可能性,也为合成生物学提供了新的工具和思路。