论文部分内容阅读
真核生物的基因组大小变化范围很广,在近缘和远缘相关的物种之间可能会发生巨大变化。后生动物中,只有直翅目昆虫和两栖动物、甲壳类动物、肺鱼、鲨鱼等类群的基因组发生了超大型化。已提出多倍体(即全基因组复制;WGD)或更小的复制事件和重复元件活动的激增两种不同的机制作为基因组进化和多样化的重要驱动因素。虽然WGD在植物进化中很普遍,但它被认为是动物进化中的一个例外情况。然而,推测古老的WGD在软体动物、两栖动物、鱼类和节肢动物的进化中发挥了重要作用。在许多真核生物基因组中,重复元件是基因组大小变异的主要驱动力。基因组的重复部分称为重复组,与物种内和物种之间的基因组大小直接相关,推断它可能在基因组大小进化中发挥重要作用。转座元件(TE)的普遍存在是因为它们能够通过RNA中间步骤(逆转录转座子,I类)或剪切和粘贴自身(DNA转座子,II类)将自身复制和粘贴到宿主生物体的基因组中。短星翅蝗(Calliptamus abbreviatus)、意大利蝗(Calliptamus italicus)和黑腿星翅蝗(Calliptamus barbarus)是在中国北方广泛分布的三个物种。这些物种是多食性的,以各种野生植物和农作物为食,尤其是豆类。星翅蝗属在17 mya(百万年前)从Peripolus属分化出来,其属内物种分化可以追溯到8.5 mya左右。越北橄蝗Tagasta tonkinensis分布在喜马拉雅山脉、中国南部和印度等地,大约52 mya与星翅蝗属分离。星翅蝗属和橄蝗属的基因组大小、系统发育位置和部分物种的转录组数据是已知的,但没有进行过重复组分析,这与其基因组较大有关。大量不同的重复DNA阻碍了参考基因组的组装过程,蝗虫超大基因组的属级TE多样化还没有系统研究过。本研究选择同属的3种星翅蝗和一种远缘物种越北橄蝗,利用基因组探查测序和转录组数据,在系统分析这些物种重复组的组成多样性基础上,比较了重复组在近缘和远缘蝗虫物种中组成多样性的演化动态及在生殖系细胞中的转录情况。本文围绕三个问题的研究获得如下的结果:(1)重复组的组成多样性及各种成分如何影响蝗虫基因组大小的变化?流式细胞仪测定的黑腿星翅蝗、意大利蝗和短星翅蝗的基因组大小分别为10.37、10.1和9.99 pg。我们使用低覆盖率的Illumina未组装短读序来研究卫星DNA和TE的进化动力学对基因组大小变化的影响。使用0.5X数据进行的Repeatexplorer2分析分别获得黑腿星翅蝗、意大利蝗和短星翅蝗基因组中的重复序列分别为52%、56%和55%,主要由LINE、Ty3-gypsy LTR反转录转座子和Tc Mar-Tc1组成。LINE元件是三个基因组中最丰富的TE,占总重复序列的33-35%。同样,DNA转座子Tc Mar-Tc1和LTR Ty3-gypsy分别占整个重复部分的第二和第三多(16-20%)。卫星组(Satellitome)、Penelope、Maverick和其他未知元素构成了TE的剩余部分。TE年龄分布显示新元件丰度比古老元件更高。重复组的比较分析揭示了除卫星DNA之外的大多数转座子在星翅蝗属的三个基因组中高度保守。在总共20个卫星DNA家族中,17个卫星DNA家族在三个基因组之间通常具有不同的丰度变化,其中3个是黑腿星翅蝗特异性的。卫星DNA家族的大小范围从最小的26 nt CSat06-26家族到直翅目中记录的最大卫星DNA家族CSat13-2150(2150 nt)。卫星DNA家族的A+T含量在39%到61%之间,中值为53.5%。发现两个卫星DNA家族CSat12-42和CSat13-2150富含G+C,百分比分别为61%和51%。卫星组分析表明,每个卫星DNA家族的单体长度在整个基因组中是不变的,但在丰度、拷贝数和分歧度方面存在差异。卫星DNA和5S_r DNA家族的重复图谱分析显示,5S-r DNA-02的颜色增强图谱与变异图谱图一样,在所有三个物种中都是相同的。然而,在(153-164)的单体位点有一个12bp的谷,推断这些碱基对由于缺失突变而被删除。三个物种的卫星DNA家族谱的变异受到相对于一致序列的重复丰度和序列分歧变化的影响。在CSat01-880和CSat05-270家族中也观察到了类似的分布模式。CSat12-26 sat DNA家族的分布表明该家族在黑腿星翅蝗中发生新增殖,并且在意大利蝗中也观察到退化的拷贝残基。(2)近缘和远缘物种重复组的组成多样性有何不同?对昆虫重复组类型丰度的全面和广泛的分析表明存在类型特定的分布,丰度变化在分类尺度上也很突出。由于TE的移动性和扩增性,重复序列可能对基因功能和基因组稳定性产生不利影响。此外,即使在较短的进化时间尺度上,重复类型和丰度也会发生巨大变化。这种快速进化对基因组进化和物种形成产生了影响。重复组分歧会导致甚至密切相关的物种之间的遗传不相容性。越北橄蝗(Tagasta tonkinensis)的基因组大小为9.79 pg,与星翅蝗属接近。我们的比较分析发现,同属3种星翅蝗和远缘物种越北橄蝗基因组之间的重复组含量相似。每个物种的基因组包含大约51-56%的重复序列。然而,与远缘物种相比,同属物种中转座因子家族和卫星组的分布变化较小。除了卫星组在拷贝数和宿主基因组特异性方面表现出更高的变异率外,转座子在同属物种中高度保守,但星翅蝗属与越北橄蝗之间仅共享少量转座子。越北橄蝗(锥头蝗科Pyrgmorphidae)与星翅蝗属(蝗科Acrididae)两者之间共享的转座子包括3个LINE元件、1个卫星DNA和一些未知的重复元件。这些共享的元件在四个基因组中的丰度(拷贝数或reads深度)和分歧度呈现不均匀分布。越北橄蝗基因组包含以下比例的各种已知元件:LINE约占总重复组的34%,DNA转座子Tc MarTc1和LTR Ty3-gypsy分别占10%和12%,几乎是星翅蝗属相同元件比例的一半;其他元件,如maverick、penelope和45S r DNA,只占基因组重复部分的一小部分。越北橄蝗的卫星组分析中已鉴定出29个卫星DNA家族。除了重复分析结果中确定的片段和残基外,没有一个卫星DNA家族在星翅蝗和远缘相关的越北橄蝗之间共享。越北橄蝗中卫星DNA家族的大小范围从每个Tat Sat01-21和Tat Sat04-21家族的最小21个碱基对到直翅目中记录的最长卫星DNA家族Tat Sat15-3744(3744 bp)。卫星DNA家族的A+T含量从42.9%到64.3%不等,中值为55.5%。Tat Sat01-21和Tat Sat23-204卫星DNA家族被发现富含G+C,分别为57.1%和52%。越北橄蝗的卫星DNA家族相对丰度范围为0.0108至0.7943%。同样,在基因组中检测到的卫星DNA的总百分比为3.4%。Tat Sat01-21是越北橄蝗中最丰富的卫星DNA家族,占0.79%,而Tat Sat28-107最少,占0.0108%。丰度与重复单元长度之间没有显着关系(Spearman秩次检验:rs=0.32,t=0.89,p=0.24)。越北橄蝗的sat DNA家族中观察到的K2P遗传差异为7.74%。Tat Sat10-1630是越北橄蝗中分歧最大的卫星DNA家族(17.28%),而Tat Sat05-1023与一致序列的分歧率最低(1.22%)。K2P分歧与单体长度之间没有显着相关性。每个卫星DNA家族的拷贝数差异很大,Tat Sat01-21的拷贝数最多(36234657.34),Tat Sat22-1464的拷贝数最少(98233.63)。Tat Sat01卫星DNA家族的颜色增强图揭示了不一致的覆盖范围和沿参考序列的reads深度变化。具有峰值边界的重复序列不均匀覆盖可能是由于重复单位截断或重复拷贝扩增差异导致,反映了新形成的卫星DNA序列的分布或最近的TE活动。类似地,Tat Sat04家族也显示了一个在参考序列长度上覆盖不等的分布,其峰值表明是最近的重复元件活动产生。越北橄蝗中具有不同分布的Tat Sat21和Ta Sat29家族显示其在基因组中发生部分扩增。(3)重复组在雄性和雌性生殖系细胞中是否存在差异表达?TE必须在表达和抑制之间保持关键平衡,才能在进化压力下不断增加。TE的表达应该足够强大以促进扩增,但不会影响宿主的适应性,抵消增加拷贝数对TE的好处。这种平衡行为可能会自然地阻碍TE编码的酶以避免转座,并迫使一些TE适应自我调节策略来处理它们自己的拷贝数。有充分的证据表明TE在多种生物的雄性和雌性生殖细胞中都很活跃,在蝗虫雌性(卵巢)和雄性(精巢)中已经报道了TE的转座。蝗虫卵巢和精巢中TE的不均匀表达意味着性别之间存在显着的TE转录变异。尽管大多数卫星DNA簇被整合到致密的异染色质中,被认为是转录沉默和惰性的,但已经发表了它们在昆虫、脊椎动物和植物中转录的证据,证明卫星DNA可以转化为小RNA,例如si RNA和pi RNA。在TE表达分析中,我们观察到899和996个TEs分别在短星翅蝗的雌性(卵巢)和雄性(精巢)生殖组织样本中以非零总reads计数表达。同样有996和1030个TE以非零的总reads计数在意大利蝗的卵巢和精巢生殖组织样本中表达。这两个物种中表达的TE比例偏向于雄性,雄性中表达的TE亚家族数量高于雌性。我们在短星翅蝗和意大利蝗的所有生殖组织样本中观察到756个表达的TE亚家族,以及45个差异表达的TE亚家族。与其他重复家族相比,LTR Ty3_gypsy被高度转录。结论对星翅蝗属重复组的比较分析表明,大多数转座因子在3个基因组中高度保守,这可归因于它们较短的分歧时间(8.5 mya),而卫星DNA家族在3个物种中存在显著的扩增或收缩,证实了卫星DNA的动态进化特性,是基因组大小变异的主要原因。重复类型的丰度和分歧度反映了一些卫星DNA家族增大和收缩过程。卫星DNA家族和r DNA的颜色增强图显示了一些重复家族中缺失突变的作用。类似的转座子家族存在于远缘的越北橄蝗(Tagasta tonkineneis)中,但除了少数共同的外,大多数是物种特异性的。最后,在星翅蝗生殖组织(卵巢和精巢)中的TEs表达是不同的,雄性中表达的TE亚家族数量高于雌性,这表明两性之间存在显着的TE转录变异。