论文部分内容阅读
多细胞真核生物的基因组DNA承载了从单个受精卵发育成完整生物体所需的所有遗传信息。为了维持种系的稳定性,DNA编码的遗传信息需要如实地传递给子代;另一方面,为了编码产生各种不同的组织细胞类型,维持组织细胞特异的基因转录谱,基因组DNA需要对其承载的遗传信息进行修饰和包装,调节时空特异的基因表达。DNA甲基化修饰被认为是最稳定的一种表观遗传修饰,其形成的碳碳键具有较高的键能,不易被破坏。在维持性DNA甲基转移酶的作用下,母代细胞基因组的DNA甲基化信息可以通过半保留复制的方式传递给有丝分裂后的子代细胞,因而DNA甲基化在不改变DNA序列的前提下增加了遗传信息的多样性。近年来的研究发现,TET家族蛋白能够将甲基化的胞嘧啶逐步氧化生成5-羟甲基胞嘧啶(5hmC)、5-醛基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC),最终导致去甲基化。5mC的氧化产物与TET家族蛋白在基因组上的分布模式不完全重叠。在小鼠胚胎干细胞中,TET1和TET2主要富集在基因转录起始位点附近,而5hmC则富集在基因的远端调控区域;在缺失TDG的小鼠胚胎干细胞中,5fC和5caC也倾向于在基因的远端调控区域积累。这些研究结果暗示:第一,存在多种机制调节5mC氧化产物在基因组上的分布;第二,DNA修饰状态的动态变化调控,可能参与远端调控区域对下游基因转录的调控。然而,目前尚不清楚其详细的作用机制和影响基因转录的程度。此外,5mC的氧化产物自身也可排斥或招募一些DNA结合蛋白。在本研究中,我们利用蛋白质定量质谱技术筛选了胚胎干细胞特异的5hmC结合蛋白,并研究了这些蛋白对其结合位点附近DNA甲基化水平,以及TET家族蛋白催化的DNA氧化反应的调节机制。我们发现:第一,在体外实验中,多能性相关的SALL1和SALL4蛋白倾向于结合带5hmC修饰的DNA;第二,在小鼠胚胎干细胞中,SALL1和SALL4形成蛋白复合物,主要定位在基因的远端调控区域;第三,SALL1和SALL4与染色质的结合在很大程度上依赖于TET1蛋白,暗示TET1催化的DNA氧化能够帮助SALL1和SALL4蛋白在基因组上定位;第四,SALL1和SALL4在基因组的结合位点上缺乏稳定的5hmC,但在缺失TDG的细胞中,5caC却在SALL1和SALL4的结合位点上有很高程度的积累,表明这些位点上具有活跃的DNA氧化反应;第五,缺失SALL4,而非SALL1导致在其原本的结合位点上积累较高程度的5hmC,但在同时缺失TDG的情况下,5caC在这些位点上的积累减少了,说明SALL4与染色质的结合能够促进其结合位点上的5hmC被进一步氧化;第六,TET1与SALL4直接相互作用,有助于其结合到SALL4定位的基因远端调控区域,进而催化这些位点上5hmC被进一步氧化。基于以上研究结果,我们认为TET1催化生成的5hmC可以帮助SALL1和SALL4在基因组上定位,相应的,SALL1和SALL4与染色质的结合能够促进TET1进一步氧化其结合位点附近的5hmC。