论文部分内容阅读
生物技术步入后基因组时代后,研究人员对表观遗传学的研究已经越来越重视,它已经成为了一个重要的研究领域。表观遗传学是指在DNA序列未发生改变的情况下,基因功能由于组蛋白修饰,DNA甲基化等因素的改变,致使其发生了可导致表型改变的可遗传变化。目前在该领域的研究中,研究者们把大量精力放在基因组印记、组蛋白修饰和非编码RNA等方面,其中组蛋白修饰又被称为组蛋白密码,它对生命基本活动有着非常重要的影响。 不同种类的组蛋白修饰在基因的活动中所起的作用也不同,为了说明组蛋白修饰的功能,研究人员提出了各种模型。研究中发现单一的组蛋白修饰往往不是单独发挥作用的,很多情况下是多个组蛋白尾部不同的共价修饰组合在一起,通过协同或拮抗机制共同起作用。一些相关的研究结果也证明了组蛋白修饰之间存在很强的关联性并且影响基因表达。因此,研究组蛋白修饰间的相关性有着重要的生物意义。 我们在研究组蛋白的修饰作用过程中发现:以往对于组蛋白修饰之间的关联研究大多局限于线性关系的探讨,而迄今为止对修饰间是否存在非线性关系的研究还不多,因此这方面还有很多的工作需不断的深入和探索。 为了研究组蛋白修饰间的关联性,我们对Pokholok等人基于全基因组免疫沉淀基因芯片技术测出的酵母组蛋白甲基化和乙酰化修饰数据进行了系统分析。首先,我们对原始数据进行了插值处理,由此得到了覆盖全基因组每1bp的16种组蛋白修饰数据。然后对于每一组修饰数据,我们以基因转录起始位点(TSS)为中心,截取上、下游1000bp范围的数据进行对齐、平均、平滑和归一化的处理。接着,根据酵母基因转录水平的不同,将所有的修饰分为两大类:一类是转录抑制或转录无关修饰群体(H3K4me1,H3K4me2,H3K79me3,H3.YPD,H4.YPD,IgG.YPD,noAB.YPD),另一类是转录增强修饰群体(H3K9ac,H3K14ac,H4ac,H3K4me3,H3K36me3,H3K14acvsWCE.YPD,ESA1.YPD,GCN5.YPD,GCN4.AA)。为了揭示两个群组中组蛋白修饰之间的复杂关联,我们分别从“宏观”和“微观”角度对组蛋白修饰之间的关联进行了研究。在“宏观”上,我们分别用Pearson相关系数法和MINE算法分别求出组蛋白修饰之间的相关程度,并绘制了heat map(热图)。然后,我们利用三维图谱找出了组蛋白修饰间存在的一些非线性的关系。在“微观”上,我们采用了局部相关算法,使得计算窗口的中心在基因TSS位点上、下游700bp的范围内移动。在这些范围内,我们按从小到大,依次选取不同尺寸的窗口(窗口的范围为100bp到600bp)进行计算。最后得到了组蛋白修饰间在不同基因位点以及不同窗口大小下的Pearson相关系数,并绘制了heat map。我们根据从“宏观”和“微观”上得出的结果,结合分类情况,对各种修饰图谱进行认真观察和分析,发现了相同和不同群组中的组蛋白修饰在整体和局部上所存在的联系。通过我们的研究,希望能够使人们进一步认识和了解组蛋白修饰间的关联,为研究相关修饰酶之间的直接或间接作用提供有价值的参考。