论文部分内容阅读
在细胞核内的三维空间中,染色质以精确的空间折叠,形成了不同尺度层次的三维基因组空间结构,使得互不相邻的两个基因组位点得以相互接触,从而实现了DNA调控元件对相关基因的表达调控。目前的染色质三维空间结构研究均集中在较大尺度结构变化上,如染色质区室(A/B compartments),拓扑相关结构域(the topologically associating domains,TADs)以及染色质环状结构(loop domain)等,而对于拓扑相关结构域内部细微的染色质三维空间结构的研究尚未被报道。本课题利用基于In situ Hi-C技术开发的SAFE Hi-C(simplified amplification-free and economically efficient Hi-C)技术,以人类癌细胞K562为实验材料,并结合相关生物信息学方法,在高分辨率下鉴定人类三维基因组细微结构。本课题成功构建出高质量SAFE Hi-C文库,并与已发表的In situ Hi-C数据相比,二者比对率大致相同,均为91%以上,Hi-C contacts分别为82.38%,69.65%,染色体内相互作用数分别为81.08%,65.06%。通过观察染色体相互作用图谱,染色体互作频率衰减曲线以及计算全基因组范围内的Border Index,发现SAFE Hi-C数据可能含有丰富的染色质空间相互作用信息。其次,本课题利用Arrowhead算法分别在SAFE Hi-C数据和In situ Hi-C数据中鉴定出拓扑相关结构域,并发现CTCF,RNA polymerase II,H3K27ac等蛋白高度富集于SAFE Hi-C和In situ Hi-C各自特异性以及共同的拓扑相关结构域边界区域。此外,通过计算SAFE Hi-C数据和In situ Hi-C数据的Border Index,本课题成功在全基因组范围内筛选了各自的border结构,发现CTCF,RNA polymerase II,H3K27ac等转录因子以及相关组蛋白修饰在两类border区域的富集情况大致相同。通过将SAFE Hi-C和In situ Hi-C的border结构的Border Index相除,进一步分析了二者染色质空间相互作用差异情况,发现SAFE Hi-C的border区域的Border Index整体上高于In situ Hi-C的border区域的Border Index,而且CTCF,RNA polymerase II,H3K27ac等蛋白在不同的比值范围的border区域有着不同的富集程度。总之,本课题为进一步分析鉴定人类三维基因组精细结构打下了坚实的基础。