论文部分内容阅读
多聚腺苷化(Polyadenylation,poly(A))是真核生物大多数信使核糖核酸(mRNA)加工成熟的必经过程,这一过程包含了 poly(A)信号的识别、3’末端的剪切和添加poly(A)尾巴。真核生物中有75%以上的基因含有至少2个poly(A)位点,并通过选择使用位点调整基因表达。因此,选择性poly(A)(Alternative polyadenylation,APA)被认为是调控基因表达的一种重要方式,与植物适应变化的环境关系密切。Cleavage and Polyadenylation Specificity Factors 100(CPSF100)是多聚腺苷化核心装置的蛋白之一,能够调控基因转录本通读,并且调控拟南芥基因表达沉默、开花时间和胚胎发育。生化研究表明,CPSF100可能是多聚腺苷化装置核心复合体CPSF的骨架蛋白,位于多聚腺苷化蛋白因子互作网络中心。另外,CPSF100为多聚腺苷化剪切因子CPSF73和RNA运输因子THOC5发挥功能所必需,表明了 CPSF100对真核细胞内基因添加poly(A)的准确进行至关重要。它又可以和RNA剪接因子共沉淀,暗示着CPSF100在RNA剪接中的潜在功能。然而,我们对CPSF100在真核生物基因的多聚腺苷化和基因转录中的具体作用还知之甚少,也还未见CPSF100是否参与poly(A)信号识别的报道。本研究利用模式植物拟南芥为研究材料,利用Poly(A)tags sequencing(PAT-seq)技术和生物信息学方法对拟南芥AtCPSF100的突变体esp5进行了全基因组范围转录本的3’末端进行高通量测序研究,并从多方面研究了这个遗传突变体的表型,主要研究结果如下:(1)AtCPSF100可以调控拟南芥的结实率和千粒重、主根长度、根毛长度和密度。它还能够调控对细菌感染的抵抗能力;(2)PAT-seq 表明 AtCPSF100 对 3’UTR 区域的 poly(A)位点(poly(A)tags cluster,PAC)和表达水平(poly(A)tags,PAT)具有显著的正调控作用,对基因间区的poly(A)位点和表达水平具有显著的负调控作用;(3)AtCPSF100不仅参与编码基因的多聚腺苷化过程,还能够参与非编码基因的多聚腺苷化过程,体现了它对全基因组范围基因的调控作用;(4)AtCPSF100调控内含子区域poly(A)位点上游近端区域的poly(A)信号选择,表明了 AtCPSF100可能与基因的转录本剪接有关;它参与调控poly(A)位点上游远端区域G-rich的poly(A)信号识别;(5)差异表达(Differential expression,DE)分析表明,AtCPSF100 至少显著调控1385个基因的poly(A)位点选择(DE-PACgene),还显著调控了 507个基因(DE gene)的总体表达水平。这两类基因之间具有398个基因重叠。表明大多数差异表达的基因都是由差异的多聚腺苷化引起的;Gene Ontology(GO)功能富集分析表明,DE-PAC gene可以被显著富集到和拟南芥生长发育和抗性等相关的14个基因类型条目中,而DE gene仅被显著富集到个别条目中,表明了与植物生长发育和抗性相关的基因更容易受到APA的调控,而AtCPSF100对基因表达的调控可能没有明显的偏好性;(6)AtCPSF100主要调控了编码具有结合活性蛋白质的基因的多聚腺苷化,并通过这些蛋白质因子的表达来实现对下游基因的进一步调控。(7)AtCPSF100可能通过调控RNA聚合酶Ⅱ(Pol Ⅱ)去磷酸化的CTD PHOSPHATASE-LIKE 3(CPL3)基因的表达水平从而调整PolⅡ的C-terminal domain(CTD)上Ser2的磷酸化水平,从而促使基因转录能够正常终止,防止发生通读导致基因沉默;(8)AtCPSF100为de novo DNA甲基化酶DRM1的表达所必需,并能够调控自身、PCF4(另一多聚腺苷化因子基因)和RNA剪接因子的poly(A)轮廓,暗示了它可能参与基因转录加工的其他过程的调控;esp5中AtCPSF100的突变可能没有引起miRNA靶标位点的增加。本研究详细阐述了 AtCPSF100在拟南芥进行准确多聚腺苷化过程中的作用,发现多聚腺苷化因子调控拟南芥表型,从而影响拟南芥的环境响应能力(如根系表型的变化可能与植物抗旱有关,抗病能力与环境生物胁迫有关)。本研究首次发现了植物多聚腺苷化因子能够同时控制编码和非编码基因的多聚腺苷化,还第一次报道了植物多聚腺苷化因子参与远端poly(A)信号选择和参与转录终止的调控。这些研究结果丰富了植物多聚腺苷化的分子机制的理论,也为我们深入理解和研究真核生物3’末端加工的工作机制奠定了基础。