论文部分内容阅读
基因编辑技术是对基因组上的目的基因进行修饰的技术,通常依赖于DNA的双链断裂(Double-Strand Break,DSB),然后通过同源重组(Homologous Recombination,HR)或非同源末端连接(Non-Homologous End Joining,NHEJ)等方法进行修复。前者需要引入同源片段和重组酶,修饰准确,但是操作复杂、效率较低且会在基因组留下编辑的痕迹;后者操作简便、效率高,但只能引入导致基因失活的插入缺失突变,无法进行精确基因编辑。而近年来出现的dCas9融合脱氨酶的碱基编辑技术不依赖于DSB的形成,具有操作简便、修饰准确、效率高和普适性强等优点,已经广泛应用于生物学的基础理论和生产应用研究中。然而,此技术受到dCas9蛋白原间隔序列毗邻基序(Protospacer Adjacent Motif,PAM)识别序列的限制,基因组中存在大量无法靶向的编辑位点,尤其对于高通量基因编辑极为不利。着眼于该弊端,目前已报道了一些拓宽PAM识别序列的Cas9人工变体,其中效果较好的有xCas9-3.7、SpG、SpRY等。由于目前尚未报道分析碱基编辑系统中dCas9及其变体的PAM识别序列偏好性规律的方法,因此我们尝试开发新型PAM识别序列分析方法。本课题致力于建立一种基于碱基编辑技术的dCas9变体PAM识别序列分析方法,通过该方法筛选PAM识别序列,分析dCas9及其变体融合脱氨酶后进行碱基编辑的PAM识别序列偏好性规律。我们首先比较了大肠杆菌中sacB、upp、pyrf、ccdb和mazf共5个反筛选标记基因的反筛效果,从中选取了效果较好的sacB和upp基因进行适用于碱基编辑筛选的分子改造,使改造后的sacB和upp基因被dCas9-CDA(七鳃鳗来源的脱氨酶)识别并编辑引入终止密码子,造成反筛选基因失活。分子改造后,sacB和upp基因均可实现脱氨编辑,并且反筛选敏感性未受影响。此后需要将sacB和upp基因的PAM序列由“NGG”修改为“NNNN”随机序列,确保适用于构建反筛选PAM识别序列文库,实验结果表明,PAM修改为“NNNN”后,upp基因的敏感性未受影响,sacB基因的敏感性几乎丧失。因此最终选择使用upp反筛选标记基因建立PAM识别序列分析方法。PAM识别序列筛选的模拟实验证明,我们建立的PAM识别序列偏好性分析系统能够有效富集发生碱基编辑的突变序列,富集能力达到50倍以上,因此进行了文库水平的实验。由于基因组整合和质粒表达upp基因的PAM识别序列筛选系统各有优势:基因组整合反筛基因单拷贝表达,易于获得纯合的脱氨编辑细胞个体,反筛选效率高;质粒表达反筛基因具有多个拷贝,反筛选效率受到一定影响,但是从整体上来看发生高效碱基编辑的PAM序列更有利于大量富集,不同PAM序列之间的识别效率差异会更加显著,有利于分析。因此,我们尝试分别构建基因组整合和质粒表达upp基因的PAM识别序列初始文库,经碱基编辑实验验证,质粒文库脱氨编辑效果较好。因此,后续实验选用了质粒表达upp基因的PAM识别序列脱氨文库进行分析。利用质粒“NNNN”PAM识别序列脱氨文库对dCas9融合CDA和xdCas9-3.7融合CDA进行PAM偏好性分析,高通量测序(High-Throughput Sequencing,HTS)结果表明:除“NRG”外,dcas9蛋白还可以利用“NYGG,NGA”PAM进行碱基编辑;除“NG,GAW”外,xdcas9-3.7蛋白还能够利用“NAG,GAS,NYGG,CAAC,AATC”PAM进行碱基编辑。同时发现,碱基编辑突变具有迭代累计的趋势,PAM识别序列文库的突变效率为Upp1A4w>Upp6A4w>Upp2A4w,dCas9变体在作用窗口内编辑时第17位碱基的突变效率低于第18位碱基。