论文部分内容阅读
棉属是世界上最重要的纤维作物。棉属共52个种,包含8个二倍体基因组(A-G和K组)和1个四倍体组(AD组)。为解析棉属种间系统发育关系,本研究测序、拼接、验证获得了棉属9个种叶绿体基因组和8个种线粒体基因组全序列,同时利用数据库中已经释放的数据,对棉属细胞质基因组分子进化进行分析。结果表明,34个叶绿体基因组能够代表了全部棉属种的进化多样性,而10个线粒体基因组数据源自棉属D组,A组和AD组种。棉属叶绿体基因组高度保守、基因分化速率慢,而线粒体基因组结构变异大、但编码基因分化速率更慢。本论文为研究棉属质核互作、揭示棉属基因组的分子进化提供了细胞质基因组基础数据。同时,利用28个陆地植物细胞内3套基因组数据分析证明:细胞内的基因频繁转移,增加了核基因组的复杂性,是细胞质基因组动态进化的重要原因。论文主要结果如下:1.棉属叶绿体基因组高度保守,和大多数的高等植物一样是四分结构:包括两个较大的反向重复区域(内含主要的核糖体RNA基因)和两个特异区域(大单拷贝区LSC和小单拷贝区SSC)。在叶绿体基因的分化过程中,叶绿体基因组中性进化,大多数基因的Ka/Ks值证明了这一点;但是,accD和psap基因的同义替换率和非同义替换率要远大于其它的基因。2.小片段Indel是棉属叶绿体基因组大小变异的重要原因。这些Indel事件,主要发生在叶绿体基因组LSC的基因间区,与棉属系统分化相吻合。棉属叶绿体基因组的核苷酸分化距离,非编码区大约是编码区的3倍;不同基因组间种间的分化距离大于同一基因组内棉种。3.基于叶绿体基因组的碱基替换和Indel信息构建了棉属种系统发育树,将本研究的34个种分为6个进化分支;棉属内种间存在迅速的辐射状分化,还有一些古老种的灭绝事件(如D组的古老祖先)。以可可为外参,计算棉属种的分化时间,棉属主要的二倍体分支祖先分化大约发生在10-11 MYA(百万年前)。4.棉属线粒体基因组结构均为环形,二倍体D基因组种长度约644kb,A组种为687kb,四倍体AD组种长度约677kb。不同于叶绿体基因组高度保守,棉属线粒体基因组结构变异明显:重复序列的变异引起线粒体基因组大量的倒位、易位。4个D组种线粒体基因组结构一致,存在6个大的重复序列;但与A组种和AD组种结构差异明显,A+AD组中存在4个大的重复序列。5.棉属不同线粒体基因组存在大量缺失变异,其中特异性片段D组有8个,A+AD组特异性片段具有3个,AD组相比于二倍体(A+D)组缺失了一个11kb的片段。6.棉花核、叶绿体、线粒体基因组间存在序列内源转移,且叶绿体基因组序列迁移到核中是随机的,无优先位点,而线粒体迁移则是优先转移atp6-trnW间区的序列到核中。雷蒙德氏棉Chr 01染色体上,插入一条线粒体基因组大片段,覆盖了线粒体基因组高达93%的比例。以陆地棉为例,我们验证了核中插入的含有SNP分化的细胞器基因是不表达的。7.利用28套陆地植物的核、线粒体及叶绿体基因组序列,比对分析发现:陆地植物细胞器间基因转移(IGT)事件在种子植物中频繁发生,在苔藓植物中鲜有发生。