论文部分内容阅读
针尾部Aculeata是膜翅目Hymenoptera细腰亚目Apocrita中一个物种丰富的类群,常见的有蜜蜂、胡蜂和蚂蚁等昆虫,主要包含青蜂总科Chrysidoidea、蚁总科Formicoidea、蛛蜂总科Pompiloidea、土蜂总科Scolioidea、钩土蜂总科Tiphioidea、Thynnoidea、胡蜂总科Vespoidea和蜜蜂总科Apoidea 8个总科。目前的研究均支持针尾部是一个单系群,然而,针尾部内部主要类群间的系统发育关系还存在争议。线粒体基因组被广泛用于进化及系统发育研究,然而,目前针尾部中许多类群还没有线粒体基因组序列被测通,限制了基于线粒体基因组的针尾部比较基因组学与系统发育研究。本研究对针尾部昆虫线粒体基因组进行测序,结合其已经公开的线粒体基因组序列,利用比较基因组学方法分析针尾部线粒体基因组成、基因间隔、密码子使用和tRN A二级结构等特征,探究针尾部内基因的重排和进化机制,重建针尾部主要类群间的系统发育关系,主要研究结果如下:(1)利用高通量的测序方法共测定针尾部5个总科10个科26种昆虫的线粒体基因组序列。首次报道了蛛蜂科Pompilidae、梨头蜂科Embolemidae、螯蜂科Dryinidae、土蜂科Scoliidae、蚁蜂科Mutillidae和钩土蜂科Tiphiidae基本完整的线粒体基因组。除热力突背青蜂Stilbum calens中trn R,单爪鳌蜂Anteon sp.中nad6,蚁蜂Mutillidae sp.1中nad1、trnL1、trnV、trn C、rrnL、rrnS,蚁蜂Mutillidaesp.3中trnI、rrnS,金毛长腹土蜂Campsomeris prismatica中trnK与旁喙蜾蠃Pararrhynchium sp.中trnQ基因和几乎所有物种的A+T富含区外,大部分种类的13个蛋白编码基因、22个t RNA基因和2个rRNA基因均被测通。(2)比较了针尾部昆虫线粒体基因组的碱基组成与密码子使用等基本特征。在已经测定的41个针尾部昆虫线粒体基因组中,A+T含量最高的是蜜蜂总科中的大分舌蜂Colletes glgas,A+T含量最低的是蚁总科中Leptomyrmex pallens。全基因组的AT偏斜在大部分物种中为正值,但GC偏斜均为负值。在蛋白编码基因中,所有的AT偏斜为负值,但GC偏斜大部分为正值。针尾部昆虫的已知蛋白编码基因起始密码子均为ATN,其中ATT是使用频率最高的起始密码子,最少的为ATC,仅有6个基因以ATC起始。主要终止密码子为TAA,但有23个基因以不完整的TA作为终止密码子,52个以不完整的T作为终止密码子,也有20个基因以TAG终止。针尾部昆虫基因重叠区的长度在1-10 bp之间,基因间隔区长度范围相差较大。使用最多的氨基酸为Leu、Ile、Phe,而使用最频繁的密码子是TTA(Leu)、ATT(Ile)、TTT(Phe)。多数t RNA基因可以折叠成典型的三叶草状结构,多数trnS1的DHU臂的D-stem配对缺失。通过计算针尾部昆虫的Pi值、同义替换率Ka与非同义替换率Ks的比Ka/Ks来探究针尾部昆虫线粒体基因组进化速率。针尾部内Ka/Ks比值均大于1。针尾部昆虫线粒体基因组中各蛋白编码基因进化速率最快的为nad2和atp8。(3)发现针尾部昆虫线粒体基因重排严重,不仅发生tRNA的重排,蛋白编码基因和rRNA基因也发生重排。在青蜂科、肿腿蜂科和土蜂科线粒体基因组内均发现蛋白编码基因的重排。重排的热点区域集中在A+T富含区-nad2、nad2-coxl和nad3-nad5。异位倒置是出现最多的重排模式。(4)利用蛋白编码基因DNA序列、蛋白编码基因和RNA基因的DNA序列、蛋白编码基因氨基酸序列构建了针尾部主要类群间的贝叶斯系统发育树。研究结果均支持蚁总科、胡蜂总科、土蜂总科、钩土蜂总科和蜜蜂总科的单系性,支持胡蜂总科与蚁总科为姐妹群关系,但所有结果均表明青蜂总科内青蜂科与螯蜂科没有形成单系群。除了基于蛋白编码基因氨基酸序列构建的系统发育树之外,其他结果均支持螯蜂科与针尾部其他类群形成姐妹关系。肿腿蜂科与蚁蜂科可能存在长枝吸引现象,导致蛛蜂总科成为并系类群,蚁蜂科与肿腿蜂科形成姐妹群,并且与胡蜂总科和蚁总科聚类在一起。在去除长枝吸引的种类后,结果均支持青蜂总科、土蜂总科和蛛蜂总科形成一个分支,胡蜂总科、蚁总科与钩土蜂总科在一个分支上。