论文部分内容阅读
本文首先介绍了生物信息学的产生背景、发展概况、研究内容以及基因组信息学的一些相关知识,具体介绍了DNA碱基序列和蛋白质序列的混沌游戏表示方法,以及怎么构造系统发生树等相关内容。 本文提出,从基因组或与其对应的蛋白质氨基酸序列的混沌游戏表示出发,计算得到相应的测度,基于测度矩阵,计算相关距离得到序列的距离矩阵,最后构造系统发生树来进行亲缘分析。为了检验我们提出的方法是否有效,我们选取了两个不同的数据集:64种脊椎动物的线粒体完全基因组序列以及30种细小病毒的蛋白质序列进行亲缘分析。我们对这两个数据集的物种的分类效果进行了分析和讨论,根据亲缘分析得出的系统发生树显示,以上方法是有效的。 同时在本文的最后,对上述方法提出了一些可能改进的初步设想,有待进一步的计算和研究。