论文部分内容阅读
棉花是世界性的重要经济作物,它既是重要的纤维作物、油料作物和盐碱地先锋作物,又是研究纤维发育、多倍体起源的模式作物,也是纺织、精细化工原料和重要的战略物资。转录组测序技术(又称RNA-Seq),是最近发展起来的利用深度测序技术进行转录组分析的技术,为大规模发掘棉花纤维发育相关基因提供了强有力的技术平台。本研究以遗传背景相似且纤维长度存在显著差异的两个陆海回交近交系NMGA-062(32.58mm)和NMGA-105(27.06mm)为材料,利用Illumina HiSeqTM2000对0、3DPA的胚珠及10DPA的纤维进行RNA-Seq测序,得到如下结论:(1)通过对构建的6个文库进行测序,每个文库获得超过51000000条高质量的序列信息,约4.6Gb的数据量。六个文库进行拼接,共得到长度大于200bp的Unigene98464个,总长度约为88.2Mb,平均长度为896bp,N50长度为1397bp。(2)通过与公共数据库NR、Swiss-Prot、KEGG、COG、GO和NT的Blast比对,77.9%的(76724个)Unigene得到功能注释。其中70094个Unigene与NR蛋白数据库有同源比对信息,24709个Unigene注释到COG的25个功能类别,32363个Unigene注释到GO数据库,37964个Unigene(38.6%)被归为KEGG中的126条代谢途径。(3)对不同材料同一时期的转录组进行差异比较分析,10DPA相比得到1931个差异表达基因,1536个上调,395个下调;3DPA相比得到5031个差异表达基因,500个上调,4531个下调;0DPA相比得到17658个差异表达基因,7579个上调,10079个下调。对同一材料不同时期的转录组进行差异比较分析,两个材料3DPA与0DPA相比得到3610个共同的差异表达基因,上调表达1771个,下调表达1839个;10DPA与3DPA相比得到14655个共同的差异表达基因,上调表达1747个,下调表达12908个。(4)对两个材料10DPA纤维中筛选到的1931个差异表达基因进行GO功能显著性富集和Pathway显著性富集分析结果表明,差异表达基因主要富集在脂质转移活性分子功能和脂质代谢通路,推测脂类相关基因可能在纤维伸长发育过程中起重要作用。从10DPA纤维的差异表达基因中挑取12个基因GhABP、GhLTP3、GhPRP3、GhRDL2、alpha-tubulin8、 E6-4、 GhEXP2、 GhDET2、 GhAnx1、 CL10581.Contig1_All、Unigene11613_All、CL12718.Contig1_All进行时空表达模式分析。(5)两个材料0、3、10DPA不同纤维发育时期比较分析,筛选到1004个差异表达的基因。利用Cluster3.0对差异表达基因进行表达模式聚类,共分为4类,a1:0DPA到10DPA表达量逐渐升高;a2:表达量先降低后升高;a3:表达量先升高后降低;a4:表达量逐渐降低。其中从a1中挑选到许多纤维伸长相关基因,a4中筛选到许多与纤维起始相关的转录因子。从纤维不同发育时期筛选到的1004个差异表达基因中挑取6个基因GhMYB5、GhCIPK1、GhGPAT6、GhFLA10、Unigene35146_All、Unigene30578_All利用实时荧光定量PCR技术分析其在纤维不同发育时期(0、3、5、7、10、15、20、25DPA)的表达模式。(6)实时荧光定量PCR分析发现,本研究得到的GhLTP3在NMGA-062各时期的表达量均高于NMGA-105,在10DPA表达量急剧升高,之后逐渐下降,表达模式与前人的研究结果一致,推测该基因是纤维伸长的正调控基因。Unigene11613_All的功能注释未知,但其在纤维伸长期高调表达,且在两材料中差异显著,可能对纤维伸长起到一定的作用。GhGPAT6在10~25DPA的纤维中表达量高,尤其在10DPA的纤维中表达量最高,但其在纤维较短材料中的表达量比较高,可能对纤维伸长起到负调控作用。以上基因的具体生物学功能,及调控纤维伸长的作用机制需要进一步验证。