论文部分内容阅读
转座子(Transposable elements,TEs)是一类能够在基因组中移动的DNA重复序列,它主要分为两类,一类是以“复制和粘贴”的方式进行转座的逆转录转座子(RNA转座子),另一类是以“剪切和粘贴”的方式进行转座的DNA转座子。微型反向重复转座元件(Miniature inverted-repeat transposable elements,MITEs)主要是指DNA转座子中不能自主进行转座的一类转座子,长度一般为50到800 bp,其序列两端有一段典型的末端反向重复序列(TIR)和靶位点重复序列(TSD)。MITEs在脊椎动物基因组中拷贝数很高,通常分布在基因附近。目前对于MITEs的含量、多样性、分布和转座机制都有较为深入的认识。鱼类的物种数(大于30,000种)占整个脊椎动物物种数一半以上,它也是海洋和淡水生态系统重要组成部分,主要包含无颌类、软骨鱼类、肉鳍鱼类和辐鳍鱼类。在鱼类演化历史中,基因复制非常频繁,复制的基因和基因组对物种进化和形成都产生影响。随着下一代测序技术的发展,鱼类基因组数据被陆续公布,为我们研究的开展提供了契机。转座子在鱼类基因组的含量很高,比如斑马鱼(Danio rerio)基因组中58%都是转座子,所以转座子是鱼类基因组的重要组成部分。MITEs是转座子中特殊的一类,目前,植物、昆虫、病毒都构建了相关的MITEs转座子库,但对鱼类的MITEs转座子还没有一个较为系统的预测。因此完成鱼类代表物种基因组MITEs转座子的准确注释和相关基因分析,将有助于对鱼类的深入研究。本研究中我们选取了34种具代表性的鱼类(无颌类3种、软骨鱼类2种、肉鳍鱼类1种、辐鳍鱼类28种)和文昌鱼(Branchiostoma belcheri)的基因组,运用生物信息学方法对这些物种基因组中的MITEs进行鉴定和比较基因组学分析,主要研究结果如下:(1)鱼类基因组中MITEs的鉴定、分类和含量我们从NCBI中下载了全基因组数据,通过MITE-Hunter等软件预测鱼类基因组中的MITEs转座子并构建一致序列,然后通过TIR、TSD的序列特征对预测得到的MITEs转座子进行分类。结果表明,鱼类基因组中主要含有的MITEs超家族有:Tc1-Mariner、PHIS、P、Kobolok、PiggyBac、hAT、Ginger、CMC、Merlin、Sola2,其中Tc1-Mariner超家族占比最大。分析MITEs转座子含量与相应物种基因组大小的关系,发现两者并无相关性。(2)MITEs在基因组中的扩增模式根据K2P模型(Kimura 2 parameter distances)计算全长拷贝序列在基因组中的插入时间。发现在鱼类的演化过程中,出现了一到两次的MITEs转座子爆发事件,多数物种的转座子爆发发生在2-0.5百万年前,并且系统发育关系较近的物种,MITEs的扩增情况类似。无颌类的蒲氏盲鳗(Eptatretus burgeri)、日本七鳃鳗(Lethenteron camtschaticum)、海七鳃鳗(Petromyzon marinus)、软骨鱼类的猬鳐(Leucoraja erinacea)和肉鳍鱼类的矛尾鱼(Latimeria chalumnae),这五种鱼类的MITEs爆发都发生在1.5-0.5百万年前。辐鳍鱼类最近一次MITEs转座子爆发发生在2.5-1.5百万年前,墨西哥丽脂鲤(Astyanax mexicanus)、斑马鱼、罗非鱼(Oreochromis niloticus)、象鼻鱼(Paramormyrops kingsleyae)和犀角金线鲃(Sinocyclocheilus rhinocerous)出现了两次MITEs爆发期。由于MITEs需要借助其他转座子的转座酶进行转座,我们筛选了相应鱼类基因组中与MITEs具有一致TIR序列的长拷贝,最终在14种鱼类基因组中发现了72条自主型转座子,包含两个超家族:Tc1-Mariner和hAT,其中大部分自主型转座子是具有DD34E结构的Tc1-Mariner。(3)鱼类基因组中MITEs邻近基因分析选取的35个物种中,只有25种有注释信息文件可以进行MITEs插入位置和邻近基因分析。结果表明完整的MITEs在鱼类基因组中主要插入到基因的3’和5’端。同时,发现MITEs存在插入到基因内部的情况,并有多个拷贝插入到基因的外显子中。另外,不同鱼类基因组中的MITEs转座子会插入到相同基因,说明鱼类MITEs转座子的靶位点具有一定的相似性。根据各个物种在AnnotationHub中对应的注释信息数据库,将被MITEs插入的基因进行GO富集分析,由于MITEs很多插入到未注释的新基因中,因此只得到12个物种的GO富集结果。其中斑马鱼、斑点叉尾鮰(Ictalurus punctatus)、弗氏假鳃鳉(Nothobranchius furzeri)、大西洋鲑(Salmo salar)都富集到与GTP酶活性相关的多个term中,象鼻鱼(Paramormyrops kingsleyae)、日本青鳉(Oryzias latipes)富集到一个与ATP酶活性相关的term,墨西哥丽脂鲤和弗氏假鳃鳉都富集到基因在蛋白激酶活性的term中。综上所述,本研究对部分鱼类基因组的MITEs进行预测、构建一致序列、分类,进一步分析基因组大小和MITEs含量的关系。计算MITEs的插入时间来研究MITEs在鱼类基因组的扩增情况,确定MITEs的插入位置来探讨MITEs相关基因的功能。研究结果丰富了脊椎动物MITEs转座子数据,填补了鱼类MITEs转座子演化研究的空白,有助于促进鱼类基因组中MITEs的功能研究。