论文部分内容阅读
昆虫是地球上物种数目最多的动物类群。昆虫mtDNA是具有小分子量的共价闭合的双链环状分子。它通常包含37个紧密排列的基因,其中13个是蛋白质编码基因。线粒体DNA由于其母系遗传,保守的基因含量和较少的重组、突变率较快(与核DNA相比),且在不同谱系中几乎保持不变,已被广泛用作系统发育研究中的中性分子标记。但在某些鸟类等动物中发现了纯化的或适应性进化力。由于同义密码子的不均匀使用是复杂进化力的指标,我们对昆虫线粒体基因组中密码子使用的综合分析,目的是估计它们的进化特征。了解昆虫的各种进化历史将有助于理解昆虫的遗传和表型进化。基于生物信息学方法,本文研究了 29目,372科,2,842种昆虫完整的线粒体基因组,分析了所有已发表不同进化地位昆虫的mtDNA的密码子使用偏好模式及其异同。其次,结合相关演化指数分析揭示昆虫形成mtDNA密码子使用模式中贡献最大的进化力。基于mtDNA偏好的详细分析可以更好地理解昆虫之间的进化关系。具体研究结果和结论如下:1.基于线粒体基因组构建的昆虫系统发育分析本研究基于线粒体基因组所构建昆虫关系的系统树拓扑结构与以往形态学和分子分类的研究结果一致。昆虫系统发育树是研究昆虫系统发育演化进化的基础。基于此昆虫系统发育树,探究昆虫线粒体基因组密码子偏好模式及其形成原因,进一步分析不同进化地位昆虫的密码子偏好模式及其形成原因的异同。2.昆虫线粒体基因组密码子偏好模式分析在昆虫线粒体基因组CDS的62个同义密码子中(除去2个终止密码子),其中30个密码子的RSCU>1,密码子出现频率高,且均以A/U碱基结尾。不同进化地位昆虫中RSCU>1的密码子总数及种类基本相同,但从无翅亚纲到有翅亚纲,RSCU值总体呈上升趋势,即随着昆虫从原始类群到进化类群的演化,这些RSCU>1密码子的使用越来越频繁。2,842种昆虫线粒体基因组的ENC值变化范围为26.81-56.08,平均ENC值为37.0,CAI值波动范围为0.200-0.868,平均值为0.579。随着昆虫的进化,从无翅亚纲到有翅亚纲,ENC值呈缓慢下降趋势,同一目的不同物种间昆虫的ENC值变化范围减小;CAI值呈缓慢上升趋势,同一目的不同物种间昆虫的CAI值变化范围也减小。通过对昆虫mtDNA的蛋白编码基因密码子RSCU、ENC和CAI值的分析,发现:随着昆虫的进化,从无翅亚纲到有翅亚纲,在线粒体基因组的蛋白质基因编码中偏爱使用的密码子总数及种类基本相同,均偏好使用以A/U碱基结尾的密码子,避免使用以C/G碱基结尾的密码子;随着昆虫从原始类群到进化类群的演化,昆虫线粒体基因组CDS密码子偏好性变得越来越强,越来越避免使用以C或G碱基结尾的密码子,而以A或U碱基结尾的密码子使用越来越频繁,且同一目的不同物种间密码子使用偏好性越来越相似,差异越来越小,即物种亲缘关系越接近,其密码子的使用模式越相似。3.昆虫线粒体基因组密码子偏好模式形成原因分析昆虫线粒体基因组蛋白编码基因密码子偏好性的影响因素是突变压力和选择作用,其中选择作用是主导因素,且随着昆虫的进化,选择作用发挥的作用越来越大。突变压力中碱基组成是影响昆虫mtDNA密码子使用模式的主要因素。选择作用中影响昆虫mtDNA密码子使用模式的因素中,基因表达水平对密码子使用偏好的选择压力有重要影响,且在不同进化地位昆虫中的影响较为相似;蛋白质成分、氨基酸性质对密码子偏好性模式的形成在不同类群昆虫中影响均较小;昆虫线粒体基因组蛋白质长度基本相同,对昆虫密码子偏好性无影响。本论文分析六足总纲大部分类群昆虫的线粒体基因组数据,使用这些序列的组合数据集,可以检索足够的遗传信息来解决昆虫中mtDNA的性质。本研究不仅分析了昆虫整体上线粒体基因组密码子偏好性模式和形成原因,依据Bernhard等人的六足总纲系统发育关系图,还将所研究的29目昆虫分为五大类群,进行不同进化地位昆虫的线粒体基因组密码子偏好性模式和形成原因异同的分析。这些结论将为我们更好地理解昆虫各类群之间的进化提供新的启示。