论文部分内容阅读
基因重复是普遍存在的现象,与基因组进化密切相关,是基因组和遗传系统分化的重要推动力.目前针对原核基因组中蛋白质编码基因序列中的重复基因的系统研究还很少.本文以四种具有不同GC%含量的原核生物基因组为研究对象,用CodonW软件对各基因组中完全相同的功能基因的密码子使用偏好进行分析,用CD-hit软件对各基因组中以80%为阈值的重复蛋白编码基因进行分析.结果表明四个基因组的蛋白编码基因中普遍存在基因重复序列,其比例占到2.77%~7.03%.对序列完全相同的功能已知基因的分析表明其序列长度分布在50bp到1