论文部分内容阅读
构建系统发生树时,由于多种生物学现象诸如不完全的谱系分选和不平衡的基因流等,会造成其拓扑结构会在不同的基因组区域产生不一致性。这个问题在分化不久的物种上进行系统发生分析时特别明显。传统上主要有两类系统发生分析方法,一致性法(consensusmethod)和总证据法(total evidence)。虽然这两种方法都有一定的可行性,但是他们对于此问题也并没有给出一个很好的解决方案。而且用这两种方法也无法对其全基因组上的拓部结构不一致性进行一个定量的分析。为解决上述问题,贝叶斯一致性分析法(Bayesian ConcordanceAnalysis, BCA)可在全基因组规模上进行系统发生树分析,并进而对不一致性信息进行量化统计。此方法通过输入相应的一组序列文件,用若干生物信息学软件(如VCFtools, RepeatMasker, PAUP*4.0,MrModelTest, MrBayes等)对其进行屏蔽重复序列、序列比对等处理,辅以Perl语言脚本,最终得到全基因组范围上不同区段系统发生树不一致信息。本课题利用BCA分析法对C3H/Hu小鼠(Mus musculus)和129/Sv小鼠回交多代产生的129S1小鼠进行系统发生树分析。为了获取数据的方便,我们以129P2代表P亚品系,以与C3H/Hu亲缘关系更近的C3HHeJ代替C3H/Hu的数据。并对129S1小鼠的染色体序列进行了传统的相似性序列分析。最后使用主流系统发生软件MEGA6.0在BCA分析法与传统的相似度分析法差生矛盾的多个基因座进行分析,以验证BCA分析法的可靠性。研究发现,虽然129S1小鼠是来源于129/Sv多次与C3H/Hu的后代,但其染色体的绝大多数区段支持129S1与129P2为姐妹拓扑结构(后验概率最高)。但是在个别基因座上BCA分析法和传统的相似性分析法产生了矛盾。通过在这些基因座上使用传统主流的系统发生分析软件MEGA6.0对进行系统发生分析,证明了相较于相似性分析法BCA能更好地对全基因组进行系统发生估计。BCA分析法证明了129S1小鼠基因组的主要来源于129品系,若干基因座受到C3H/Hu小鼠基因组的基因渗入。这与报道先前关于129小鼠来源的报道相一致。BCA分析法通过两次贝叶斯估计能很好地估计出物种的各个基因座进化发生过程,并且使各个基因座相互信息共享。这对研究物种进化有一定帮助。