论文部分内容阅读
棉花是天然纤维的主要来源,也是纺织工业最重要的原料。干旱对棉纤维品质影响较大,然而,棉纤维细胞应答干旱的分子机制尚不清楚。利用高通量RNA-seq技术可以初步全面理解复杂的生命活动,高效锁定目标功能基因。本研究以纤维品质优良的陆地棉品种农大棉13号为材料,设置正常灌溉(盛花期前补灌一次,水量675 m3/ha)和干旱(盛花期前不补灌)两种条件,采集开花当天(0 day post anthesis,0 DPA)和5 DPA胚珠以及10、15、20、25、30、35 DPA纤维提取RNA构建文库并进行RNA-seq,通过生物信息学分析,鉴定两种条件下随纤维发育差异表达的mRNA和长链非编码RNA(long noncoding RNA,lncRNA),解析灌溉组和干旱组纤维发育相关代谢通路的变化规律;以灌溉组为对照,筛选干旱条件下差异表达和稳定表达的mRNA和lncRNA,挖掘棉花耐旱性状候选基因。本研究将为深入解析棉纤维发育机制和棉纤维响应干旱胁迫的分子机理提供重要的理论依据和基因资源。主要研究结果如下:1.共鉴定出47 095个mRNA和13 051个lncRNA,其中lncRNA包括11 683个基因间长链非编码 RNA(long intergenic noncoding RNA,lincRNA)和 1 368 个长链非编码天然反义转录本(long noncoding natural antisense transcript,lncNAT)。lncNAT平均转录本长度(1 883 nt)显著长于lincRNA(1 327 nt)和mRNA(1 307 nt);绝大部分lincRNA和lncNAT外显子数目小于6,平均外显子数分别为2.34和3.06,而mRNA外显子数目变化范围更为广泛,平均外显子数为5.90,明显高于lncRNA;lincRNA和lncNAT整体表达水平和GC含量均低于mRNA。2.通过各处理组内不同时间点间比较(包括与0 DPA以及与前一个时间点的比较),筛选出随纤维发育而差异表达的35 569个mRNA和6 943个lncRNA,其中32162个mRNA和5 460个lncRNA在灌溉组差异表达,33 027个mRNA和6 208个lncRNA在干旱组差异表达,说明干旱处理使棉纤维转录组发生了更广泛的响应。差异表达转录本代谢通路富集分析结果表明,在灌溉组呈极显著或显著富集的部分代谢通路在干旱组富集程度减弱甚至不富集,主要有“25 vs 20”比较组合中的戊糖磷酸途径以及甘氨酸、丝氨酸和苏氨酸代谢途径,“30 vs 25”组合中氮代谢途径,“35 vs 30”组合中吞噬体途径以及抗坏血酸盐和糖二酸代谢通路;在灌溉组未富集的部分代谢通路在干旱组显著甚至极显著富集,主要有“30 vs 25”组合中的吞噬体途径和“35 vs 30”中玉米素生物合成。3.通过两处理组同一时间点间比较,筛选出差异表达的mRNA和lncRNA各3 427、1 021个。靶关系预测结果显示,540个(15.76%)差异表达mRNA可能受到差异表达lncRNA调控,并且在纤维发育起始期(0 DPA)有更大比例(25.44%)的差异表达mRNA可能受到差异表达lncRNA调节。差异表达mRNA代谢通路富集分析结果表明,在纤维发育起始期有5条代谢通路显著富集,特别是植物激素信号转导和光合作用-天线蛋白通路;在纤维发育伸长期(10、15 DPA)有11条代谢通路显著富集,主要包括植物激素信号转导和苯丙烷生物合成;在次生壁合成期(25、30、35 DPA),细胞壁发育相关的脂质代谢、能量代谢、氨基酸代谢和苯丙烷生物合成在内的16条代谢相关通路和1条ATP结合盒转运蛋白通路显著富集;在转变期1(5 DPA)仅有3条遗传信息加工相关代谢通路显著富集。差异表达lncRNA靶标差异表达mRNAGO分析结果显示,细胞壁组织与生物发生、细胞壁大分子代谢过程显著富集,说明这些差异表达lncRNA主要调控细胞壁发育。通过共有miRNA结合位点预测分析,鉴定出4组响应干旱的“差异表达lncRNA-miRNA-差异表达mRNA”调控组合。4.通过两处理组同一时间点间比较,筛选出稳定表达的mRNA和lncRNA各4 247个、27个,基于此,构建了权重基因共表达网络,该网络可划分成4个模块(module,ME)即ME1、2、3、4,各模块中基因分别在纤维发育早期(0、5 DPA)、伸长阶段(5-15 DPA)、次生壁合成阶段(20-35 DPA)以及纤维发育伸长和次生壁合成阶段(10 DPA至35 DPA)优势表达。功能富集分析结果显示,ME1中的基因主要富集在毛状体形态发生、花发育、乙烯激活信号通路的调控、茉莉酸介导的信号通路等和纤维发育起始或起始到伸长期转变相关的生物学过程,ME2中的基因主要富集在蛋白质泛素化相关生物学过程以及纤维细胞伸长所必需的活性氧代谢过程调节,ME3中的基因在蛋白质泛素化相关生物学过程继续显著富集,此外还在乙烯响应、糖介导的信号通路等过程显著富集,ME4中的基因有一部分在蛋白质泛素化相关生物学过程显著富集,这和模块ME2、ME3相似,另一部分主要富集在多维细胞生长。各模块中连通度最高的30个核心基因,即为干旱条件下维持棉纤维正常发育的候选关键基因。5.根据转录组结果,发现肌醇加氧酶代谢途径中的重要基因肌醇加氧酶基因MIOX、磷酸肌醇合酶基因MIPS,在灌溉组与干旱组间以及纤维发育过程中均差异表达。将这两个基因及该途径中的肌醇磷酸酶基因1MP和葡萄糖醛酸激酶基因GlcAK在模式植物拟南芥中进行功能验证。结果显示,与野生型相比,超表达MIOX、GlcAK的拟南芥表皮毛极显著变长,超表达MIOX、MIPS、IMP、GlcAK的拟南芥下胚轴也极显著变长,证明这4个基因在细胞伸长中具有重要作用,是潜在的纤维伸长发育相关基因。干旱胁迫后过表达MIOX拟南芥植株萎蔫程度轻于野生型,说明MIOX确实参与干旱应答。综上所述,本研究鉴定出正常灌溉和干旱条件下棉纤维中差异表达基因和差异表达lncRNA、稳定表达基因和稳定表达lncRNA,构建了纤维发育表达谱,挖掘出纤维发育和干旱胁迫应答相关通路;初步明确了一些lncRNA调控mRNA表达的潜在方式,为进一步研究其分子功能提供了有价值的信息;在模式植物拟南芥中过表达纤维发育相关基因MIOX、MIPS、MP、GlcAK可以促进细胞伸长,过表达MIOX可以提高拟南芥耐旱性。