论文部分内容阅读
原始生殖细胞(Primordial germ cells,PGCs)是精子和卵母细胞的祖先细胞,致力于将遗传信息传递给后代。不同物种中,PGCs的迁移过程存在相似和差异。尽管最终PGCs都是通过背肠系膜迁移到性腺生殖嵴中。但是,达到背肠系膜的方式在不同物种中存在差异。有别于穿过后肠上皮达到背肠系膜的主动迁移方式(果蝇和小鼠等),禽类PGCs通过血管系统被动迁移到背肠系膜。这一独特的迁移路线使鸟类PGCs成为遗传资源保护和制备生物反应器的良好材料。其中,鸡以低成本、高产量和易操作等优势成为研究PGCs形成和应用的最佳选择。然而,在实际操作中,有限的体内PGCs数量导致种系嵌合鸡中供体衍生后代的比例较低。即使消减受体PGCs的数量也无法解决这一问题,因此,亟需寻找提高PGCs数量的新方式。体外模拟PGCs特化过程有利于研究其发生机制,进而从遗传角度提高PGCs的数量。关键调控基因(Blimp1、Prdm14和Sox17等)、BMP和WNT信号转导系统和细胞因子(RA、SCF和bFGF等)被发现能决定PGCs的特化。随着研究的深入,表观遗传的重编程也成为影响PGCs生长发育的重要因素。然而,大量占据基因组位置的非编码RNA和高度保守的组蛋白修饰在鸡PGCs形成中扮演的角色尚不明确,同时表观遗传修饰之间的互作机制也并不清晰。为此,本研究基于前期发现的H3K4me2正向调控鸡PGCs形成的研究结果,利用CHIP-seq深入分析PGCs中组蛋白 H3第4赖氨酸二甲基化(H3K4 dimethylation,H3K4me2)的富集模式和转录调控模式。联合前期发现的lncCPSET1(chicken-PGCs-specifically-expressed transcript 1),研究长链非编码 RNA(long non-coding RNA,lncRNA)和H3K4me2联合对鸡PGCs形成的影响。同时从转录前水平,探究H3K4me2如何和DNA甲基化竞争调控lncCPSET1的转录;从转录后水平,探究H3K4me2如何与lncCPSET1协同调控PGCs关键基因转录。为从表观遗传角度研究鸡PGCs的发生机制,完善PGCs的调控网络,提高体外PGCs诱导效率提供理论依据,同时为研究多重表观遗传修饰对基因转录的调控提供参考。研究结果如下:(1)H3K4me2是鸡PGCs形成必需的基于前期发现的H3K4me2促进鸡PGCs形成的研究,收集胚胎干细胞(Embryonic stem cells,ESCs)、PGCs和精原干细胞(Spermatogonial stem cells,SSCs)进行H3K4me2 CHIP-seq测序,分析发现H3K4me2的peak主要富集在ESCs中,在PGCs中散在分布,而在SSCs中重新获得peak。采用MACS对H3K4me2在DNA序列结合的长度(peak峰值的宽度)分析发现,ESCs中peak峰宽度主要集中在200~1000 kb,PGCs中peak峰宽集中在300~500 kb,而SSCs中peak集中在300~1000 kb。分析peak富集倍数发现ESCs中peak数最多,富集倍数为5-10倍,PGCs中peak和reads数减少,SSCs中则出现peak的回升。说明H3K4me2在三种细胞中呈现动态变化。对H3K4me2在全基因组功能区域的富集分析发现ESCs中peak集中在转录起始位点上下 3 kb(Transcriptional Start Site,TSS±3kb)内,PGCs中peak在TSS位点两端富集,TSS±5kb趋向均匀分布,SSCs中在TSS±3kb区域内富集。H3K4me2 summits富集的数量在PGCs中少于ESCs和SSCs。基因组区域分布结果发现启动子区PGCs中H3K4me2富集水平低于ESCs和SSCs。对启动子区H3K4me2富集变化分析发现,相较于ESCs,PGCs中出现274个新peak峰,1094个peak峰丢失。在其中,67.9%H3K4me2富集的基因呈现peak峰在PGCs中丢失(与ESCs相比)的现象,包括与PGCs相关的Cvh、Blimp1、Lin28、C-kit、Alpl、Bmp4、Bmpr1b、Wnt5a、Tcf712 等基因,表明H3K4me2的动态表达参与细胞谱系确定。进一步对H3K4me2富集的宽度进行深入分析发现,PGCs中多以Narrow(200-1000 bp)窄区富集的形式存在。对窄区的基因和RNA-seq发现的基因进行维恩分析发现,151个基因在PGCs中表达,且RPKM分析呈现高表达,包括Kit、Alpl、Cvh、Blimp1、Lin28、Bmp4和Bmpr1b等,GO和KEGG通路分析发现窄区基因富集到更多的信号通路,PGCs中窄区集中了 362个基因和11个信号通路,包括WNT、转化生长因子-β等。PGCs中BMP4信号被H3K4me2窄区富集,qRT-PCR发现PGCs-like诱导过程中,H3K4me2激活BMP4信号通路关键信号分子Bmp4、Bmpr1a、Bmpr2、Id2、Smad5和C-kit的表达(P<0.01)。因此,H3K4me2通过窄区富集的形式启动PGCs特异基因和信号通路的表达,是PGCs形成必需的表观遗传因子。(2)lncCPSET1协同H3K4me2调控PGCs形成前期通过对ESCs、PGCs和SSCs的RNA-seq测序分析筛选出15个与生殖细胞分化相关的差异lncRNA,本研究将预测靶基因为Bmp4的lncRNA TCONS00874170 定义为lncCPSET1(chicken-PGCs-specifically-expressed transcript 1)。qRT-PCR 检测发现 lncCPSET1 在 PGCs 中特异表达(P<0.05),且NONCODE分析发现lncCPSET1在鸡中高度保守。在体外诱导模型中,利用组蛋白甲基化酶Mll2干扰载体和lncCPSET1分别单独和联合转染ESCs,发现单独干扰Mll2/lncCPSET1后,类胚体数量减少;同时干扰Mll2和lncCSPET1后,抑制类胚体形成。进一步通过qRT-PCR发现,PGCs标记基因Blimp1的表达极显著降低(P<0.01),三胚层标记基因Gata6和Eomes显著降低(P<0.05)。流式细胞分析和间接免疫荧光显示,PGCs-like细胞数量减少。相反,同时干扰组蛋白去甲基化酶Lsd1和过表达lncCPSET1显著提高PGCs-like数量(P<0.05)。将lncCPSET1干扰载体和Mll2干扰载体进行体内血管注射,qRT-PCR结果显示同时干扰Mll2和lncCPSET1,生殖标记基因Ddx4和Blimp1的表达极显著降低(P<0.01);流式细胞分析显示,PGCs数量显著降低(P<0.05)。反之,同时干扰Lsd1和过表达lncCPSET1显著提高体内PGCs形成数量(P<0.05)。以上结果说明lncCPSET1联合H3K4me2协同促进PGCs体内外形成。(3)H3K4me2协同转录因子Jun促进lncCPSET1的转录为了研究H3K4me2和lncCPSET1之间的调控模式,本研究首先对lncCPSET1转录过程中H3K4me2的调控进行研究。在PGCs中分别干扰Mll2和Lsd1,Western blot检测发现干扰Mll2后,H3K4me2水平降低;而干扰Lsd1后H3K4me2表达水平升高,同时qRT-PCR结果显示,干扰Mll2显著抑制lncCPSET1的表达(P<0.05);反之,干扰Lsd1显著提高lncCPSET1的水平(P<0.05)。双荧光素酶活性检测发现干扰Mll2,lncCPSET1启动子活性极显著降低(P<0.01),而干扰Lsd1后,lncCPSET1启动子活性极显著升高(P<0.01),说明H3K4me2 通过Mll2/Lsd1调控lncCPSET1 转录。CHIP-qPCR发现H3K4me2极显著富集于lncCPSET1启动子区(P<0.01),且PGCs中P1片段上的富集极显著高于ESCs和SSCs中(P<0.01)。干扰Mll2后,P1片段上H3K4me2富集极显著降低(P<0.01);而干扰Lsd1后,H3K4me2的富集显著升高(P<0.05)。为探明lncCPSET1启动子区可能存在的其他表观遗传修饰,进一步对启动子区进行生物信息学分析,发现该区域存在一个长度为199bp的CpG岛,并存在7个甲基化位点,且P1片段既存在H3K4me2富集又存在CpG岛。重亚硫酸盐测序结果表明P1片段上的DNA甲基化在ESCs中为77.1%,PGCs中为67.1%,SSCs中为87.1%,呈动态表达。收集DNA甲基化酶抑制剂5’aza处理后的DF1细胞和PGCs-like,qRT-PCR结果发现5’aza显著抑制lncCPSET1的表达(P<0.05)。为了研究DNA甲基化和H3K4me2同时存在情况下的双重表观遗传修饰如何调控lncCPSET1表达,引入转录因子作为观察对象。通过JASPAR在线网站对lncCPSET1的启动子P1片段进行转录因子预测,对79个潜在转录因子进行GO注释和KEGG富集分析,筛选获得JUN、TCF3和CREB1三个候选转录因子。成功构建三个转录因子的过表达载体并验证载体活性。通过双荧光素酶报告系统和qRT-PCR发现,仅JUN可极显著提高lncCPSET1 的启动活性和mRNA水平(P<0.01)。进一步通过CHIP-qPCR发现PGCs中JUN可结合lncCPSET1的启动子区P1片段。qRT-PCR证明体外诱导体系中过表达Jun也能极显著提高lncCPSET1的表达(P<0.01)。接着利用Lsd1干扰载体和Jun过表达载体,通过双荧光素酶报告系统和qRT-PCR检测确定H3K4me2水平的升高极显著提高JUN对lncCPSET1的转录调控。CHIP-qPCR检测发现干扰Lsd1后JUN和lncCPSET1启动子区的结合极显著升高。说明H3K4me2可促进转录因子JUN结合lncCPSET1启动子调控其表达。而qRT-PCR和双荧光素酶报告载体检测发现5’aza添加极显著抑制JUN对lncCPSET1的正向转录调控(P<0.01)。进而分析低水平的DNA甲基化抑制JUN促进转录作用的原因,qRT-PCR发现尽管低DNA甲基化极显著促进Jun的mRNA水平(P<0.01),但其对JUN蛋白水平无显著影响;CHIP-qPCR发现低DNA甲基化也不影响JUN和lncCPSET1启动子区的结合。为探究低DNA甲基化是否影响H3K4me2的水平,Western blot和CHIP-qPCR检测发现低DNA甲基化显著降低H3K4me2水平(P<0.05)而不影响其在lncCPSET1启动子片段1的富集。接着,为研究哪一种表观遗传修饰主导lncCPSET1的表达,同时转染Lsd1干扰载体和5’aza处理DF1和PGCs,双荧光素酶报告和qRT-PCR检测发现当5’aza和Lsd1干扰同时存在的情况下,lncCPSET1转录水平显著提高(P<0.05),伴随H3K4me2和JUN在lncCPSET1启动子区的富集显著提高(P<0.05)。在此基础上,同时过表达Jun,双荧光素酶报告、qRT-PCR和CHIP-qPCR检测发现lncCPSET1转录水平极显著提高(P<0.01),以上结果说明相较于DNA甲基化,H3K4me2主导转录因子JUN对lncCPSET1 的激活。(4)lncCPSET1和H3K4me2共调控的候选关键基因筛选鉴于lncCPSET1和H3K4me2协同调控PGCs形成的研究结果,本研究进一步挖掘二者共调控的靶基因。收集lncCPSET1过表达载体转染的PGCs,qRT-PCR检测发现lncCPSET1的表达极显著增加(P<0.01)。将三次独立实验获得的PGCs混合,进行转录组测序分析。火山图和MA图显示过表达lncCPSET1后,产生大量差异表达的基因。对差异基因进行GO分析发现,大量基因集中在生殖过程、代谢过程、细胞核过程和信号传导过程。COG分析发现过表达lncCPSET1,影响转录和翻译过程。KEGG注释分析发现差异基因广泛富集在氧化磷酸化代谢、P450和ECM通路,参与信号转导、信号分子互作、转录、细胞增殖和凋亡等过程。将转录组测序和H3K4me2的CHIP-seq联合分析,差异基因维恩分析发现存在495个受lncCPSET1正向调控且H3K4me2差异富集的基因。将这些基因进行GO注释和KEGG富集分析发现,候选基因集中在JNK级联调控、细胞命运决定、Wnt信号和ERK1/ERK2级联调控等生物学过程,分子功能注释发现候选基因富集于RNA结合和DNA结合功能;且广泛富集于Wnt信号和Tgf-β信号通路。进一步筛选lncCPSET1和H3K4me2协同调控的靶基因,将Wnt信号和Tgf-β富集到的差异基因进行热图分析,各筛选出4个与细胞分化的相关的基因,与lncCPSET1的预测靶基因Bmp4进行启动子区组蛋白甲基化酶富集预测,结合qRT-PCR结果,最终确定Fzd2、Id1、Id4和Bmp4为候选基因进行后续验证。(5)lncCPSET1作为MLL2/COMPASS支架调控Bmp4表达的研究为了进一步探索lncCPSET1和H3K4me2协同调控靶基因表达的机制,本研究从lncCPSET1和组蛋白甲基化酶复合体(MLL2/COMPASS)二者之间的调控模式进行研究。首先成功构建组蛋白甲基化酶COMPASS(ASH2L、DPY30、WDR5和RBBP5)的真核过表达重组标签载体 pcDNA3.1-Ash21-FLAG,pcDNA3.1-Wdr5-GST,pcDNA3.1-Dpy30-HIS,pcDNA3.1-Rbbp5-MYC。qRT-PCR和Western blot验证mRNA和标签蛋白的表达。为确定鸡中4个组蛋白甲基化酶以复合体的形式存在,Co-IP验证发现ASH2L、DPY30和WDR5三者之间能互相结合,而RBBP5与DPY30、WDR5之间的结合较弱。qRT-PCR检测发现分别过表达4个组蛋白甲基化酶后,仅Ash21和Wdr5显著提高Bmp4的表达(P<0.05)。而过表达lncCPSET1 后,qRT-PCR检测发现PGCs-like和PGCs中Fzd2、Id1、Id4和Bmp4表达极显著提高(P<0.01)。因此确定Bmp4为受lncCPSET1和MLL2/COMPASS协同调控的靶基因。为研究lncCPSET1和组蛋白甲基化酶之间的调控模式,首先过表达lncCPSET1,qRT-PCR检测发现Dpy30表达显著升高(P<0.05),Co-IP检测发现干扰/过表达lncCPSET1都不影响复合物之间的结合,但干扰lncCPSET1抑制了DPY30的蛋白表达。进一步通过RIP实验发现lncCPSET1的转录本可与DPY30结合。接着研究组蛋白甲基化酶DPY30与Bmp4启动子区的结合。CHIP-qPCR发现DPY30富集于Bmp4启动子区。以上结果说明lncCPSET1可通过结合DPY30介导的组蛋白甲基化酶复合体富集于Bmp4启动区调控其表达。综合上述结果可以得出推论:PGCs中H3K4me2通过Narrow区(200~1000 bp)的形式富集于启动子区,促进JUN结合启动子区激活lncCPSET1表达;转录后的lncCPSET1与MLL2/COMPASS成分中DPY30结合,靶向Bmp4启动子区。通过该方式,lncCPSET1和H3K4me2协同促进体内外PGCs的形成。