论文部分内容阅读
真核生物中转录调控包括两个水平,一个是转录因子的调控,一个涉及到染色质的调控,前者包括转录因子行使转录起始,延伸,终止的功能,后者包括染色质复合物影响核小体从而影响转录相关蛋白和DNA的可接近。此外,转录因子和转录相关蛋白也可通过募集组蛋白修饰酶对核小体进行修饰调控这种可接近性,不同的组蛋白修饰造就基因的不同的转录活性。核小体中组蛋白的组成,如组蛋白变异体的替换也可影响蛋白和DNA在染色质水平的可接近性,组蛋白变异体在基因组中特定区域的整合对基因的表达起着重要的作用。对这些错综复杂的转录调控的研究有助于我们更深入了解基因的表达机制。本论文一方面通过对两条同源染色体上不同转录因子和组蛋白修饰进行研究,展示一种整合多个数据进行等位基因特异性蛋白-DNA相互作用分析的实用方法。另一方面探讨组蛋白变异体H2A.Z和H3.3对染色质高级结构以及基因转录活性的调控机制,为基因的表达提供一条分子机制线索。基于测序数据分析等位基因特异性事件的方法通常面临着低统计强度的缺陷,此外,不同蛋白在两条染色体上的等位基因特异性协同作用模式知之甚少,我们提出了一种新算法iASeq用来整合多重蛋白与DNA结合信息推测其等位基因特异性,采用贝叶斯层次混合模型学习大量蛋白之间的等位基因特异性相关模式,该模型之后可以借助于数据间的信息提高蛋白在两条染色体上结合偏好性的检测。应用于GM12878细胞系在ENCODE中的来自于34个转录因子和组蛋白修饰的77个ChIP-seq样本以及一个全基因组数据,我们发现不同蛋白在偏好性地结合于染色体上时,具备结合方向一致性,并且也表明和基于单个数据集分析而比,iASeq能提高等位基因特异性的检测能力。这部分的研究对于在如今高通量基因组数据井喷累积而计算方法缺乏的挑战下如何揭示其内在的生物学意义具备很大的应用价值和启示作用。组蛋白变异体H2A.Z,H3.3的转录调控作用一直存在不一致性,在转录过程中的动态分子机制并不清楚,并且对染色质的高级结构的特征影响缺乏清晰认识,我们采取小鼠胚胎干细胞体系,结合我们自主产生的小鼠胚胎干细胞全基因组开放染色质图谱,从全基因组水平查看了H2A.Z和H3.3在调控元件增强子和启动子的分布情况,以及其对基因表达的影响。我们的全基因组ChIP-seq分析结果显示相比H2A.Z, H3.3在相对开放的染色质中分布更多些,并且H3.3在位于开放染色质区域的增强子上相比位于压缩区域的增强子分布更多,实验结果表明增强子上高富集的H3.3在基因的转录激活过程中存在脱落。同时结合基因表达信息,我们发现H2A.Z在沉默的启动子上分布更多,并且实验结果也表明了在基因激活过程中发生脱离。我们提出了H2A.Z, H3.3对基因调控的一个分子模型,阐述了组蛋白变异体在染色质高级结构水平调控的作用,对在转录过程过程中二者对转录调控功能的动态性进行了清晰的认识,从而为组蛋白变异体对转录调控提供一条分子线索。