论文部分内容阅读
由稻瘟菌(Magnaporthe oryzae)引起的稻瘟病是水稻最严重的病害之一。虽然有关稻瘟菌基因组和转录组的研究很早就已经开始了,但是至今依然有存在许多问题没有解决,比如稻瘟菌究竟有多少个基因表达,有多少个基因存在剪接多样性等。本研究利用RNA-Seq技术对稻瘟菌的转录组进行了深入分析,并试图回答这些问题。本研究比较了稻瘟菌田间菌株P131分生孢子与营养菌丝,以及田间菌株Y34营养菌丝的转录组数据。以菌株70-15的基因组作为参考基因组,利用一种整合依赖基因组和不依赖基因组拼接方法的混合拼接策略对稻瘟菌的基因组进行重新注释,发现了大量之前没有报道过的基因。首先,本研究发现稻瘟菌基因组至少表达16,192个基因及其19,418种转录本,这比最新的注释要多出约3,300个基因和约6,000种转录本。其次,本研究发现稻瘟菌表达基因中有2,358个基因存在多种不同的转录本,其中1,738个基因包含两种转录本,620个基因包含超过三种以上转录本。这些基因转录本的产生涉及了 3,479个可变剪接事件,说明可变剪接被稻瘟菌广泛利用。稻瘟菌的可变剪接类型以内含子保留为主,此外还包括可变受体位点,可变供体位点以及外显子跳跃。这些可变剪接事件可导致转录本编码不同的蛋白(distinct protein),或者含有不成熟终止密码子(premature termination codon,PTC)的转录本出现,亦或者不改变蛋白的序列特征。在稻瘟菌营养菌丝和分生孢子之间约有52~60%的可变剪接事件存在调控,这些受调控的基因倾向于编码诸如转录因子,激酶等调控相关的蛋白;而在菌株之间有24%~36%的可变剪接事件存在显著调控,大约是组织之间的一半。说明这些可变剪接对稻瘟菌的生长和发育有着重要的意义。此外,稻瘟菌的可变剪接可能受剪接复合体蛋白表达的调控。再次,在本研究发现的新基因中,包含了 230个新的蛋白编码基因,这些蛋白编码基因大多属于稻瘟菌特有基因,并且倾向编码小蛋白。其中许多基因的表达量在营养菌丝和分生孢子之间存在明显差异,这些基因可能参与稻瘟菌形态发育,成长,甚至致病等过程。本研究还从P131和Y34当中分别鉴定了 80和140个菌株特异性的基因,其中有一半以上是以前没有报道过。此外,本研究通过对分生孢子和营养菌丝基因表达量的比较,还发现分别有291和302个基因在分生孢子和营养菌丝当中显著上调表达。同时,发现373个分生孢子特异性表达的基因和1,142个基因营养菌丝特异表达的基因。这些基因包含了许多已报道的参与孢子形成或和致病相关的基因,说明这些基因可能参与多种功能。本研究的一个重要进展是发现稻瘟病菌表有约3,000个位点转录长链非蛋白编码RNA(long Non-coding RNA,lncRNA)。这些lncRNA来源位点分布广泛,有许多来源于蛋白编码基因间区,也有许多来自蛋白编码基因负义链或者内含子中。在已发表的基因插入突变体库当中,有约150个插入位点是位于这些长非编码基因当中,说明本研究新发现的长非编码基因可能在稻瘟菌的生长、发育和致病性中分别起着重要的作用。本实验室之前发现了一个控制分生孢子形成、菌丝生长和致病性的基因PCG1,并确定该基因编码RNA剪切体Prp19复合体的一个新组分。本研究通过对P131野生型和pcg1敲除体的转录组数据进行比较,发现大量内含子的剪切效率在pcg1敲除体当中受到了的影响。通过对这些内含子特征进行一系列的挖掘,本研究发现在内含子供体位点与branch point之间存在branch point mimic基序。由此推测:稻瘟病菌有一类内含子,其中包含多个branch pointmimic基序,此类内含子的剪切需要Pcgl;缺少Pcgl导致Prp19复合体组分间互作关系改变,从而不能识别真正的branch point,以致该类内含子剪切效率的降低。以上结果表明:稻瘟菌在转录组层面的复杂性远远超出了过去对稻瘟菌的认知程度。基于本研究的结果,作者提出了多个新的观点,希望这些观点将加深我们对稻瘟菌转录组的认识,并且对后续研究有积极意义。