论文部分内容阅读
在现代分子进化研究中,根据现有生物基因或物种多样性来重建生物的进化史是一个非常重要的问题。系统发生是指生物形成或进化的历史。其主要的研究对象是进化关系,系统发生分析就是要推断或者评估这些进化关系。通过系统发生分析所推断出来的进化关系一般用分支图表(进化树)来描述。进化树描述的同一谱系的进化关系包括了分子进化、物种进化以及分子进化和物种进化的综合。
本文以介绍系统发生学原理为开篇,详细的讨论了系统发生学所涉及的重要主题。这些主题包含了进化模型选取,构造系统发生树,评估系统发生树。接续这些内容,本论文将重心放在改进后的Quartet方法介绍,此方法通过计算Quartet的序列进化模型,来改良Quartet方法中对Quartet选取的判断和组合。
进化模型一般包含有两个组成部分:系统分支模型和基因序列进化模型即核苷酸取代模型。系统分支模型主要是描述种系或者序列建立和缺失的过程,采用系统发生树来阐述系统发生关系;核苷酸取代模型描述的是基于序列点突变的统计模型。本文详细的描述了主要的进化模型,还进一步探讨了各种进化模型之间的关系。
在本文的后半部分详细介绍了系统发生分析中的Quartet族系方法。Quartet族系方法是基于观察quartet集合来描述系统的一种混合的分而治之的方法。它的主要过程是将问题分解为多个小的重叠集合,对这些小的独立集合进行解决,然后再最优化的合并独立集合,从而将问题解决。Quartet方法的第一步;Quartet inference集合推理过程(QI):对于包含有n个序列对象的数据集s我们推导出所有的(n/4)个quartet拓扑。任何已知的经典系统发生方法都可以用来求解quartet拓扑结构;第二步:系统发生树推理过程(TI):在这一阶段,QI中quartet的拓扑结构被重新调配,从而得到一个未知进化树T的估值T,这里进化树T模仿了S中序列真实的历史演变过程。
在对Quartet族系方法进行详细介绍后,本文将描述基于Quartet Puzzle的改良系统发生分析算法的实现,在Quartet集合推理过程与系统发生推理过程中针对序列数据进行进化模型判断,为Quartet判断与组合过程提供模型依据。