论文部分内容阅读
DNA甲基化与核小体定位关系密切,是重要的表观遗传修饰之一,参与许多重要的生物学过程。DNA N6-甲基腺嘌呤(N6-methyladenine,N6m A),又名6m A,广泛分布于原核生物,并作用于DNA错配修复、染色体复制、细胞防御、细胞循环监管、转录等过程。但在高等真核生物中,由于含量极低而难以检测,这种修饰一直未受重视。直到最近,多篇文章揭示了诸如衣藻、线虫、小鼠、果蝇和非洲瓜蟾的真核生物基因组中6m A修饰的存在,引起表观遗传界的关注。但是,6m A功能与核小体定位的具体关系仍不清楚。本课题利用生物信息学和统计分析方法,系统地分析了莱茵衣藻、线虫和人类的6m A数据,并结合核小体定位数据、增强子数据和染色质构象数据,深入探讨了6m A与核小体定位的关系,以及6m A对基因表达的调控作用。我们分析了莱茵衣藻中6m A与核小体定位的关系,发现6m A在莱茵衣藻基因组中呈现出有规律的分布,同时6m A与核小体定位存在互斥关系。首先,我们统计6m A在全基因组的分布,发现在莱茵衣藻中6m A富集于5’UTR(5’untranlated region,5’非翻译区)。进一步研究发现5’UTR区域的6m A甲基化程度与基因的表达呈正相关,说明5’UTR中6m A可能与基因表达等功能有关。随后进一步分析基因转录起始位点(TSS,transcriptional start sites)周围的6m A与核小体定位,发现6m A和核小体对基因表达都有一定的促进作用,核小体和6m A在分布上存在互斥关系,结合CAGT聚类及功能区域分析,发现6m A与核小体定位的模式可能与不同功能区域有关。分析了线虫基因组中的6m A与核小体定位的关系,发现6m A在起始转录位点富集,可以促进基因表达,同时6m A与核小体存在互斥关系。线虫由于基因组5m C的缺失,一直被认为是无甲基化生物,但最近的研究推翻了此前的认知,发现其基因组内广泛存在着6m A修饰,并很可能在表观遗传的过程中担任重要的角色。因此,我们基于线虫三代测序数据,利用CAGT聚类、Meth SMRT等生物信息分析方法,发现6m A在TSS有一定的富集,并且6m A修饰与基因表达呈正相关关系,也发现在6m A位点会出现核小体的缺失,且随着6m A与TSS距离增加,6m A位点的核小体缺失会更明显。同时,6m A与核小体的互斥关系存在不同的模式,不同模式中6m A周围+1、+2核小体的占据水平存在明显的差异,并且与6m A相对于TSS的位置无关。我们采用基因组三维结构数据分析人类基因组中的6m A,发现人类基因组中的6m A与核小体存在复杂的关系,并且6m A显著富集于TAD(topological associated domain,拓扑相关结构域)的边界。首先对人类基因组中6m A在全基因组上的分布进行分析,探讨6m A分布规律;然后分析TSS、TTS(transcription termination site,转录终止位点)周围核小体与6m A的分布,从而研究6m A与核小体的关系。随后结合染色质构象数据分析6m A在TAD中的分布,在三维基因组中研究6m A的分布。最后结合功能分析探讨6m A在人类淋巴细胞中的生物学功能。研究结果发现人类细胞中的6m A富集于线粒体,同时在性染色体出现显著缺失现象,可能与不同染色体腺嘌呤含量不同有关。在功能区域上,6m A富集于基因区、增强子区、外显子区等区域,对基因表达有一定促进作用。6m A甲基化修饰不仅调节基因表达,还与核小体存在特定的相互关系。在TSS附近,6m A与核小体成互斥关系,但整体分布上,6m A甲基化位点会出现较高的核小体占据现象,表明可能人体中6m A可能更倾向于修饰核小体上缠绕DNA,而在启动子区域,收转录启动的影响,6m A会呈现与核小体定位互斥的现象。结合染色质构象数据分析,我们发现6m A富集于拓扑染色质结构域的左侧边界,同时6m A更倾向于富集在强TAD边界,说明6m A可能参与染色质构象的形成。综上所述,三个物种的6m A修饰在起始转录位点都有一定的富集,促进基因表达;6m A在不同区域与核小体定位有不同的相互关系,这表明6m A与核小体定位的关系会受到它们所处的基因组区域影响。6m A修饰可能与细胞发育有关,这会引起在不同物种之间6m A功能及分布的差异。我们的研究工作对了解不同物种6m A修饰的功能,尤其对深入认识6m A和核小体定位关系提供数据和信息支撑。