论文部分内容阅读
真核细胞中,染色质结构的基本单位是核小体,核小体和组蛋白修饰等表观遗传修饰共同参与基因转录调控。近年来,很多研究揭示了人类基因组中转录起始位点附近的特定的核小体占据和组蛋白修饰的分布模式,发现在转录起始位点上游存在的核小体缺失区,有利于转录因子与DNA结合。G-四链体结构是富含鸟嘌呤的DNA或RNA分子通过氢键配对形成的空间结构。通过荧光标记或序列分析等方法,发现G-四链体结构广泛存在于基因组端粒区、启动子区和5UTR区,并参与基因复制与重组、端粒延伸、基因表达调控等生物学过程。目前,对G-四链体的研究大多数是利用序列模体进行分析的,由于细胞内G-四链体和核小体都是动态变化的,仅通过序列特征分析并不能反映真实生物环境下的G-四链体存在情况以及G-四链体与核小体相互作用关系。随着高通量测序技术高速发展,我们获得了全基因组水平G-四链体测序数据,我们将G-四链体与核小体定位、组蛋白修饰、染色质三维构象结合起来,系统分析它们在基因转录调控中发挥的协同作用。 我们分析了全基因组水平G-四链体与核小体及表观遗传修饰的相互关系。首先探究G-四链体的分布特征,发现G-四链体主要形成在基因组上染色质开放的区域,另外在基因的关键调控元件显著富集,例如启动子、5UTR、剪切位点等,说明G-四链体在基因转录调控中发挥重要作用。随后分析了G-四链体与核小体定位在全基因组水平宏观的相互关系,发现G-四链体和核小体表现出竞争关系,在稳定的G-四链体形成时核小体发生缺失,稳定性较差的G-四链体存在的位点通常存在清晰核小体定位。同时分析了组蛋白修饰和G-四链体结构的相互关系,发现G-四链体对激活性质的组蛋白修饰(H3K4me3、H3K27ac)存在较强的招募作用,对抑制作用的组蛋白修饰(H3K27me3)存在一定的排斥作用。G-四链体结构形成的区域是富含CpG位点的,发现这些位点发生甲基化的比例降低,说明G-四链体是抑制DNA甲基化的。 根据G-四链体在基因转录起始位点附近的差异分布,我们研究了G-四链体、核小体定位、组蛋白修饰水平对基因转录水平的调控作用。发现在TSS上游的启动子区,位于编码链的G-四链体结构有助于排斥DNA和组蛋白结合形成核小体,使得转录因子结合位点暴露出来;位于模板链的G-四链体结构有可能招募转录因子与之结合促进基因表达;而在TSS下游,位于编码链上的G-四链体结构有助于维持DNA解旋状态,显著促进基因表达;形成于模板链上的G-四链体会阻碍RNA聚合酶Ⅱ,抑制基因表达,由此我们提出了G-四链体介导的转录调控模型。 我们进一步分析了G-四链体结构与染色质构象之间的关系。发现G-四链体结构倾向于分布在染色质结构域的边界。在染色质拓扑关联结构域(TAD)内部染色质通常紧密凝缩,不利于G-四链体形成,在TAD边界区域通常富集增强子、沉默子、启动子等基因调控元件,说明了G-四链体结构富集在与基因表达调控相关的活跃的染色质区域。此外还发现了G-四链体富集在染色质环的颈部,说明了G-四链体结构参与调控染色质远距离空间构象变化。 综上所述,G-四链体结构会影响局部核小体定位和组蛋白修饰,改变染色质局部空间结构从而调控基因转录,也可能将基因组上远距离的DNA在空间上拉近,影响染色质空间构象。我们提出的G-四链体结构调控基因转录模型对理解表观遗传修饰与染色质空间结构有借鉴意义。