论文部分内容阅读
苹果属是蔷薇科苹果亚科的一类开花植物,主要分布在北温带地区,具有重要的经济和观赏价值。由于种间形态特征复杂多样,频繁的杂交和渐渗一直伴随着苹果属的进化,导致该属系统发育关系尚未完全解决。中国拥有21个苹果属物种和丰富的栽培品种。叶绿体基因组为母系遗传,没有重组等复杂的演化信息;简化基因组为双亲遗传,通过大量的标签序列可获得全基因组的变异信息,这些特性在植物系统发育关系方面具有重要意义。因此,为了理清苹果属物种的系统发育关系和主要栽培品种起源,基于叶绿体基因组和简化基因组变异信息重建苹果属的系统发育树,在此基础上进一步推断苹果属的生物地理学历史,推测亚洲物种是否参与了国外观赏海棠的驯化,以及栽培苹果(Malus×domestica)起源,探讨苹果属叶绿体基因组在演化过程中经历了哪些适应性进化。本研究通过高通量测序组装出苹果属13个物种和13个主要栽培品种的叶绿体基因组,结合GenBank发布的苹果属18个物种叶绿体基因组序列对苹果属的叶绿体基因组演化进行深入分析。此外,研究通过简化基因组测序(RAD-seq)对中国的35种苹果属植物(21个物种,14个栽培品种)进行DNA变异检测。基于叶绿体基因组和简化基因组变异信息,使用最大似然法(ML)和贝叶斯推断(BI)的方法对苹果属系统发育关系进行重建,利用BEAST、RASP和Paml软件估算苹果属物种分化时间,重建祖先分布区,推断苹果属的演化历史和筛选正向选择位点。取得的主要结果如下:
(1)对26个苹果属植物的叶绿体基因组进行了测序组装和解析。组装后的叶绿体基因组序列长度为159,908-160,230bp。与已发表的苹果属叶绿体基因组一样,所有样品的叶绿体基因组都具有典型的四分体结构,包含一个大单拷贝区(LSC:87,964-88,349 bp)、一个小单拷贝区(SSC:19,176-19,214 bp)、两个反向重复区(IR:26,348-26,370 bp)。该属基因组GC含量非常相似,为36.50-36.58%。所有基因组编码相同的113个独特基因,其中包含79个蛋白编码基因、30个tRNA基因、4rRNA基因。rps12基因具有反式剪接结构,其5外显子位于LSC区,3外显子位于IR区。在这些基因中,共有15个基因含有一个内含子,2个基因含有两个内含子。
(2)对苹果属的叶绿体基因组比较分析表明,基因组结构相对保守,无基因重排事件。国内21个苹果属物种中检测到788个SNP和大量的简单重复序列(SSR)。叶绿体基因组可视化分析,以新疆野苹果(M.sieversii)叶绿体基因组为参考基因组,发现IR区域的序列变异低于LSC和SSC,高变异区域多位于非编码区。此外,我们分别将编码区和非编码区提取出来,进行核苷酸多态性分析,成功筛选3个高变异区域(Pi>0.01),rps12,ndhC-trnV和trnR-atpA。对苹果属适应性进化分析中,成功检测到rpoB基因包含正向选择位点。
(3)分别利用叶绿体全基因组序列、编码区序列和非编码区序列的数据集进行系统发育分析,重建苹果属系统发育关系,得到的拓扑结构基本一致,表明系统发育关系较为可靠,其中以全基因组变异信息构建的系统发育树的支持率最高。系统发育树结果支持苹果属为多系类群,主要分为两大支系即亚洲支系和欧美支系,与传统分类学不完全一致,属间及属下的分类问题需进一步修订。从国外引进的观赏海棠以及美洲的窄叶海棠(M.angustifolia)和褐海棠(M.fusca)与亚洲支系聚为一支,栽培苹果与欧洲野苹果的亲缘关系比新疆野苹果更近。台湾林檎(M.doumeri)和欧美支系位于苹果属系统发育树的基部,这可能与这些物种在进化中较为原始有关。
(4)基于化石校准节点,我们使用BEAST软件对苹果属的分化时间进行估算。研究结果表明,苹果属的起源时间约为40.15Ma,亚洲支系的分化时间为33.14Ma。欧美支系的分化时间为25.0Ma。基于系统发育树和物种地理分布信息,生物地理学分析结果推测苹果属植物的共同祖先主要分布于亚洲地区,之后由东亚地区经白令陆桥迁移至北美再到欧洲及地中海地区。
(5)基于35个苹果属植物的简化基因组数据(RAD-seq),我们使用不同方法构建系统发育树(ML和BI),其拓扑结构完全一致,将苹果属分为4个支系,且支持率较高。在苹果属样品的群体遗传结构分析中,部分个体检测到了基因池混合现象,这为进一步揭示苹果属复杂的网状进化模式奠定基础。
(1)对26个苹果属植物的叶绿体基因组进行了测序组装和解析。组装后的叶绿体基因组序列长度为159,908-160,230bp。与已发表的苹果属叶绿体基因组一样,所有样品的叶绿体基因组都具有典型的四分体结构,包含一个大单拷贝区(LSC:87,964-88,349 bp)、一个小单拷贝区(SSC:19,176-19,214 bp)、两个反向重复区(IR:26,348-26,370 bp)。该属基因组GC含量非常相似,为36.50-36.58%。所有基因组编码相同的113个独特基因,其中包含79个蛋白编码基因、30个tRNA基因、4rRNA基因。rps12基因具有反式剪接结构,其5外显子位于LSC区,3外显子位于IR区。在这些基因中,共有15个基因含有一个内含子,2个基因含有两个内含子。
(2)对苹果属的叶绿体基因组比较分析表明,基因组结构相对保守,无基因重排事件。国内21个苹果属物种中检测到788个SNP和大量的简单重复序列(SSR)。叶绿体基因组可视化分析,以新疆野苹果(M.sieversii)叶绿体基因组为参考基因组,发现IR区域的序列变异低于LSC和SSC,高变异区域多位于非编码区。此外,我们分别将编码区和非编码区提取出来,进行核苷酸多态性分析,成功筛选3个高变异区域(Pi>0.01),rps12,ndhC-trnV和trnR-atpA。对苹果属适应性进化分析中,成功检测到rpoB基因包含正向选择位点。
(3)分别利用叶绿体全基因组序列、编码区序列和非编码区序列的数据集进行系统发育分析,重建苹果属系统发育关系,得到的拓扑结构基本一致,表明系统发育关系较为可靠,其中以全基因组变异信息构建的系统发育树的支持率最高。系统发育树结果支持苹果属为多系类群,主要分为两大支系即亚洲支系和欧美支系,与传统分类学不完全一致,属间及属下的分类问题需进一步修订。从国外引进的观赏海棠以及美洲的窄叶海棠(M.angustifolia)和褐海棠(M.fusca)与亚洲支系聚为一支,栽培苹果与欧洲野苹果的亲缘关系比新疆野苹果更近。台湾林檎(M.doumeri)和欧美支系位于苹果属系统发育树的基部,这可能与这些物种在进化中较为原始有关。
(4)基于化石校准节点,我们使用BEAST软件对苹果属的分化时间进行估算。研究结果表明,苹果属的起源时间约为40.15Ma,亚洲支系的分化时间为33.14Ma。欧美支系的分化时间为25.0Ma。基于系统发育树和物种地理分布信息,生物地理学分析结果推测苹果属植物的共同祖先主要分布于亚洲地区,之后由东亚地区经白令陆桥迁移至北美再到欧洲及地中海地区。
(5)基于35个苹果属植物的简化基因组数据(RAD-seq),我们使用不同方法构建系统发育树(ML和BI),其拓扑结构完全一致,将苹果属分为4个支系,且支持率较高。在苹果属样品的群体遗传结构分析中,部分个体检测到了基因池混合现象,这为进一步揭示苹果属复杂的网状进化模式奠定基础。