论文部分内容阅读
近年来,许多研究表明基于线粒体基因组的系统发生分析比单存依靠单一或部分基因片段进行的系统发生分析信息量更大,说服力更强。蓝蛸(Octopus cyaned)和栗色蛸(O. conispadiceus)为两种常见头足类,其分布广,经济价值高,尤其是前者为我国重要的经济种类之一。然而,基于线粒体基因组对蛸科动物的研究并不多,目前只有5个物种线粒体基因组测序完成。本研究新测定了这2种蛸的线粒体基因组,并构建已知全序列的鞘亚纲头足类的系统发生树。蓝蛸线粒体基因组全长为15,938 bp,共编码37个基因,与其它海洋贝类不同的是,其蛋白编码基因中含有atp8基因,故而蛋白编码基因大于12个(protein coding genes),这些基因中除nad3基因外,其余基因中的AT含量均在70%以上,在atp (atp6和atp8)基因中高达79.5%。使用最多的密码子是UUU (F),最少的密码子则是GCG (A).氨基酸使用频率也存在较大差异,亮氨酸的使用频率最高,异亮氨酸次之,丙氨酸的使用频率最低。2种tRNA基因在该物种中出现了重复,分别为trnS1 (gct和tga)和trnL (tag和taa)。蓝蛸线粒体基因组中有22个独立的非编码区,较栗色蛸的数量多,其总长度为1,017 bp,片段大小在1-822 bp之间不等,其中有8个长度大于10 bp的非编码区,最长非编码区占线粒体基因组总长的5.2%,长度为822 bp。这一非编码区中发现了3个79 bp的重复,A、T、G、C含量分别为40%,35%,7%,17%。栗色蛸(O. conispadiceus)的线粒体基因组全长为16,027 bp,其线粒体基因组中同样含有37个基因,也编码atp8基因。其蛋白编码基因中也存在碱基组成偏斜,在nad2, nad3, nad5, nad64个基因中AT含量均高于80%,除coxl中AT含量为68.2%略低于70%外,绝大多数基因中的AT含量介于70-80%之间。A、T、G、C4种碱基,在不同的基因中含量差异大,同样表现出三种类型,高T低G,高A低G,高T低C。栗色蛸的线粒体基因组中非编码区较蓝蛸少(18个),长度在1-971 bp之间不等,总长度为1,089 bp,大于10 bp的区域有7个,最长非编码区为971 bp,占整个线粒体全基因组的9.2%。此区域,发现2段(13bp和14bp)较为典型的串联重复序列,各自含有3.2和3.3个拷贝。相比于其它软体动物非编码区中存在的1000 bp以上大片段重复序列,栗色蛸中的串联重复序列不长。利用新测定的2种蛸和目前已公布的其它全部头足纲动物线粒体基因组,共计29种头足类的13个蛋白质编码基因的核苷酸信息,以鹦鹉螺作为外群,依据最大似然法(maximum likelihood, ML)和贝叶斯法(Bayesian inference, BI)方法构建了该纲动物的系统发生树。研究结果显示线粒体全基因组可作为物种鉴定及系统发生研究的有效手段,能区分亚目以上分类阶元。研究还发现,蓝蛸、栗色蛸、真蛸和小孔蛸聚在一起,而后与短蛸、长蛸和栗色蛸聚为一支,表明蛸属与拟蛸属和小孔蛸属具有较近亲缘关系。另外,不论是依据ML还是贝叶斯方法构建的系统发生树均支持鞘亚纲和蛸科动物的单系发生。