论文部分内容阅读
基因芯片技术(DNA Microarray)已广泛地应用于生物学研究的各个领域,并成为大规模检测基因表达活性的基本手段。覆瓦式芯片,即Tiling-path Microarrav是一种在整个基因组范围内无偏地检测所有功能元件转录活性的芯片设计思路,具有比传统基因芯片更多的用途,例如:对基因组的注释信息提供实验证据,对预测基因结果进行验证和修改,对基因组中未注释的转录单元的检测,寻找可变剪接的内含子、外显子等等。本论文主要介绍应用覆瓦式芯片对水稻基因组的转录活性以及水稻基因组DNA甲基化与组蛋白修饰研究的一系列结果。
第一部分主要介绍针对处理NimbleGen芯片数据而开发的软件包——-NMPP (NimbleGen Microarray data Processing Pipeline)。NMPP整合了Affymetrix MAS 5.0,RMA(Robust Multi-Array Average)等几种目前流行的处理单通道高密度寡核苷酸芯片数据的算法,采用集中处理模式,高效快捷地完成大规模基因芯片表达数据的提取,加工,储存与分析。NMPP不仅可以应用于对传统的基因表达芯片的数据处理,也可以广泛的应用于免疫共沉淀芯片(ChiP-on-Chip),比较基因组杂交(Comparative Genome Hybridization)芯片,单核苷酸多态性再测序(SNPre-sequencingl)等基于Tiling-path设计的芯片的原始数据处理。
第二部分内容首先介绍基于PCR扩增基因组DNA片段为探针(平均3 Kb)的Tiling Array对水稻四号染色体的转录活性分析,以及不同基因区域的转录活性在不同发育阶段的变化情况。在这项研究中,作者发现在水稻发育的早期阶段(根,茎,苗期)主要是编码蛋白的基因高度表达,而与转座子元件相关的基因受到抑制;而在水稻发育后期的成熟组织中(花穗,旗叶),转座子元件的转录活性被大规模地激活了,而编码蛋白的基因受到了抑制。这一现象实际上与4号染色体在不同发育阶段,染色体结构的异染色质化与去异染色质化的调节有关。
其次介绍应用高密度覆瓦式芯片(Tiling array)对水稻其中一个亚种——籼稻(indica),进行的全基因组范围转录活性分析。该Tiling-pam芯片的基因表达数据对水稻35,970(81.9%)个注释基因的表达活性提供了实验依据,并检测到5,646个基因间区域的信号簇,可能是目前算法和软件无法预测的新基因。通过与植物EST数据库比对发现其中近30%的序列与植物基因存在同源性,并成功地克隆到了部分新基因的序列。Tiling-alTav在每条染色体上的信号强度分布图谱,揭示了染色体上基因转录活性的分布与染色质细胞学结构特征有着密切的联系,并依据Tiling Array在1号和4号染色体上的信号分布,通过FISH实验准确地确定了这两条染色体的常染色质区与异染色质区的边界。最后作者比较了水稻indica基因组上18对片段复制(segmental duplication)区域的转录活性,发现部分复制区域的转录活性在整体上具有一定相关性,尤其是11号和12号染色体上一对距离现代发生最近的(53 MYA)一次基因组片段复制区域,表达信号的相关性高达0.731,暗示着这两个复制区域中的基因功能尚未完全分化,还存在相似的表达行为。最后,作者详细地介绍对水稻(J~aponica)基因组中新转录活性区(TAR,NovelTranscription Active Region)的系统分析。水稻(japonica)Tiling Array共检测到存在于基因间区域的25,346个TAR,对这些TAR的表达谱分析证明,83%的TAR在10个水稻组织器官中具有表达活性,并处于相对等量的表达水平,只有近2%的TAR具有组织特异性。全面系统的分析对80%的TAR进行了细致的解释,并按照不同基因组功能单元进行了归类:例如,有些TAR是具有可变剪接基因的产物,有些TAR是某些基因反义链上的转录产物,有些是转座子携带的基因复制片段,有些则可能是非编码RNA的前体。
第三部分将介绍应用TilingArray对水稻基因组中4号和10号染色体的:DNA甲基化(DNA methylation)和两种组蛋白修饰(histone modification)——H3K4Me3和H3K4Me2的分析结果。DNA甲基化,H3K4Me3和H3K4Me2的定位图谱(Mapping)表明,三种修饰都在靠基因的5’端有较高水平的修饰。基因组中的转座子等重复序列区的DNA甲基化水平很高,起到对转座子转录活性的抑制作用,而基因上以H3K4Me3和H3K4Me2为主要修饰,具有促进基因表达的作用。此外,作者将三种修饰的位点与基因组中的CpG岛,tRNA,非编码RNA,T-DNA插入位点,Tos-17插入位点进行了图谱定位,不同的基因组位点都具有不同的修饰模式。
三种修饰对表达的作用方式具有一定的位置效应,DNA甲基化高频率地发生在基因转录区(Gene bode),并且只有发生在转录区才能在某种程度上抑制基因表达活性,而如果DNA甲基化发生在上游启动子区,则没有明显的抑制基因表达的作用。H3K4Me3发生在基因启动区和转录区将对基因的表达活性有最大程度地促进作用,而H3K4Me2发生在基因转录区才具有一定的促进基因表达的作用。作者也分析了三种组织特异性修饰与基因组织特异性表达的关系。在对非编码RNA的分析中发现,不同组织间的ncRNA也具有特异的修饰模式。因为本实验是第一次将三种功能上相反的基因组修饰综合在一起研究的,因此发现很多基因同时具有一种以上的修饰,由于三种修饰的作用结果都是不一样的,谁在修饰中占有主导地位,以及三种修饰是如何相互作用,相互转变的都是未知的。通过对基因共修饰的研究,我提出了“共价修饰竞争模型”(CovalentModification Competition Model),此模型可以合理地解释这三种修饰是如何相互作用,相互竞争,进而调控基因转录活性以及表达水平的高低的。