论文部分内容阅读
随着高通量测序技术的发展,价格低廉、分析方便的转录组数据已经成功运用于非模式生物研究的多个方面。本研究旨在探索转录组测序能否成功应用于灯台报春组(报春花属)的分子进化与系统发育研究,为这个在快速发生的类群的物种形成和适应性进化提供新的观点。 报春花属(Primula)的物种是重要的早春园艺植物,物种形成和分化的中心在中国西部的喜马拉雅-横断山区的东部。由于缺少基因组数据,报春花属的居群遗传,物种形成和系统发育研究都停滞不前。首先,我们对报春花属的两个近缘种海仙花(P.poissonii)和香海仙报春(P.wilsonii)利用Illumina平台进行转录组测序,这是报春花属的第一批高通量测序数据。海仙花和香海仙报春拼接后分别获得了55,284和55,011条contigs,N50长度分别是938和1,085,两者之间共有的直系同源基因有6,654条。我们为这些直系同源基因计算了非同义和同义替代的比例,发现有877组直系同源基因可能受到正选择,功能富集分析发现这些基因主要涉及到DNA修复和抗逆,这也许与这两个物种对不同的环境的适应有关,例如干旱,高海拔和强辐射。我们也计算了这两个物种之间的分化时间,大约是0.95±0.57Ma,这个时间恰好是更新世的Donau-Ounz间冰期。对于含有SSR的直系同源基因,其中54组成功设计了可以通用的引物,并对部分引物进行实验验证。根据前人得到的959个四种模式植物中共有的单拷贝基因,我们在报春花属两个种中发现111个单拷贝基因,并在内含子两边的外显子上设计引物。这两种分子标记的开发,将进一步促进报春花属遗传改良、群体遗传和系统发育方面的研究。 高通量测序产生了大量的转录组数据,这些转录组数据逐渐被应用于系统发育重建。然而,如何处理这么大量的序列和什么是最适合的分析方法仍值得探究。杜鹃花目的物种是古老的快速辐射形成,我们选择了来自杜鹃花目不同科的7个物种作为研究的内部类群。利用从头测序和从公共数据库下载的转录组序列,我们鉴定了221条直系同源的蛋白编码基因,并用于重建杜鹃花目(Ericales)的系统发育。在本研究中,串联(concatenation)法和溯祖法(coalescence)法产生了相同的种间关系且得到较高支持,但是与前人的观点有两处不同,主要涉及到瓶子草科(Sarraceniaceae)和报春花科(Primulaceae)的系统位置。本研究发现通过分段(partition)的策略可以改善常规的串联法。使用真实数据和模拟数据分析后发现,不同进化速率的基因对系统重建有不同的影响,进化快的基因在串联法分析中会降低支持率和准确性,但对溯祖法分析影响不大;相反地,进化慢的基因在串联法分析中影响较小,但是会降低溯祖法分析的支持率。另外,为了得到可靠的系统树,计算复杂的溯祖法分析需要的基因更少。综上所述,溯祖法分析受到基因的进化速率和数量的影响比串联法分析更小,更易于得到可靠的结论。 报春花属以及灯台报春组(sect.Proliferae)的分布和分化中心都在中国的西南部地区,该类群进化过程中经历过物种爆发,而这种物种爆发的机制还不清楚。使用报春花属25个种的转录组,以已经完成基因组测序的黄花九轮草(P.veris)为参考,总共鉴定了2432组直系同源基因,并用于系统树重建。我们发现缺失数据对系统树结果影响不大,溯祖法的支持率比串联法低。在我们的分析中,灯台报春组是一个单系类群,而且与紫晶报春组(Sect.Amethyatina)和脆蒴报春组(Sect.Petiolares)关系更密切。灯台报春组内部分成两个大支。根据D统计值的方法,我们发现藏报春(P.sinensis)和华柔毛报春(P.sinomollis)对整个灯台报春大支都存在基因流,不过灯台报春组内检测不到基因流。我们选择了四个关键类群,比较其基因树树形的分布,发现指叶报春组(Sect.Cortusoides)和报春花组(Sect.Monocarpicae)的共同祖先可能是藏报春(Sect.Auganthus)组和皱叶报春组(Sect.Bullatae)的杂交种,海仙花(P.poissonii)复合体和芒齿灯台报春(P.melanodonta)复合体内部关系清晰,但是霞红灯台报春(P.beesinana)复合体关系复杂,可能还处于物种分化的初期。