论文部分内容阅读
云南山茶(Camellia reticulata)是山茶属植物中最著名、最具经济价值的物种之一,以其花卉和茶油闻名于世。云南山茶原产中国西南,极具地区特色,适应我国西南山地和独特的高原季风气候,在花卉、油茶产业和特色旅游业中都具有重要的作用。但是,目前云南山茶遗传信息资源极其缺乏,使得我们对云南山茶与产油、花色形成和开花时间控制相关的基因及其调控机制知之甚少;也制约着利用分子标记、优异基因和丰富种质资源在现代遗传育种中的发掘利用。因此,本研究使用Illumina技术对云南山茶进行转录组测序。主要结果如下:1.应用Illumina RNA-seq技术对云南山茶的叶芽、成熟叶、花苞、花和果实五个组织的转录组分别进行建库和双端测序,获得了约311.3 x 106条高质量Reads。利用Trinity软件进行拼装,我们一共获得了141,460条Unigenes,总长约为96.1 x 106 nt。系统的转录组评估结果显示,我们获得了一个高质量的转录本数据集,适合用于SSR分子标记开发和代谢通路基因发掘等下游研究。2.通过与公共蛋白质数据库进行比对,有69,922个Unigene被注释为蛋白质编码基因。在与拟南芥和葡萄的基因组比对过程中发现,在云南山茶转录组中被注释到的基因平均有超过3个拷贝,暗示云南山茶可能经历过全基因组重复事件。3.我们将RNA-Seq的干净reads匹配到转录本上以评估基因的表达量水平,使用实时荧光定量反转录PCR (qRT-PCR)对基于RNA-seq的表达量分析进行检验评估,结果显示两个方法得到的表达量吻合度很高。一共有94,450个Unigene至少在一个组织中表达(FPKM≥1),其中22,229个Unigene在不同组织间存在差异表达(|fold change| ≥ 4且FDR≤0.001)。4.我们观察到云南山茶成花转变起始于4月中旬左右,这个时间段日照时间超过了12小时。这表明光周期成花途径有可能参与了云南山茶的成花转变过程。除了CONSTANS (CO)和CYCLING-DOF-FACTOR-1 (CDF1)没有找到之外,我们找到了光周期成花诱导途径中的绝大部分候选基因。这条途径中的基因存在多个拷贝;多拷贝基因间一般在组织间表现出不同的表达模式,如SOC1_α、SOC1_b和SOC1_c基因。5.我们在云南山茶转录组中一共找到了93个可能参与了三酰甘油酯生物合成的Unigene。其中,42个Unigene为差异表达基因(DEG)。一共有29个(69%)DEG在花苞和花中高表达,其中有些基因是脂肪酸去饱和酶基因,如SAD_α、FAD2_α、FAD2_b、FAD3, FAD8_b和FAD8_c。这些结果说明在花发育过程中可能需要大量不同的脂肪酸发挥作用,而且这些在花中高表达的脂肪酸去饱和酶基因还可能在云南山茶花组织的抗寒性中有重要作用。与成熟叶片相比,FAD2_α在种子中的表达量大量减少,而SAD_α和FATA基因在种子中的表达量则增加了3倍以上。基于这些结果,我们认为SAD_α和FATA可能是云南山茶在种子中合成油酸的关键基因。上调SAD_α和FATA基因、同时下调FAD2_α在种子中的表达可能是一个非常有效的控制茶油中单不饱和脂肪酸和多不饱和脂肪酸比例的方式。6.类黄酮和类胡萝卜素是植物中两大主要的天然色素。前人在山茶属植物的花瓣中检测出了类黄酮和类胡萝卜素,表明在山茶属植物中这两类化合物可能参与了山茶花的花色形成。基于同源性分析,我们找到了56个参与类黄酮生物合成的Unigene,还找到了33个参与类胡萝卜素的生物合成的Unigene。通过对序列和表达量的比较分析,我们可以评估某个基因的变异程度。例如,类黄酮合成途径中的MYBF1转录因子基因在序列和表达模式上都存在着很大的变异,我们推测它可能失去了原有的功能。表达谱聚类分析表明,MYBA1_α与几个花色素苷合成特异基因聚在一个亚支,如UF3GT_α、UF3GT_c、UF5GT_b。 MYBAl1_α和这几个花色素苷合成的特定基因在花苞或花中的表达量显著提高,表明这些基因在花发育时的花色素苷合成过程中有着重要作用。在类胡萝卜素合成途径中,多个直接催化合成常见类胡萝卜素的色素化合物的基因,如LUT1、LUT2、LUT5和LYC,在云南山茶花苞或花中的表达量都很低。这些基因在花中的表达量下调很可能是云南山茶花中类胡萝卜素含量极低的原因。我们推测,类黄酮合成途径的花色素苷合成支路在云南山茶的花色形成过程中起着支配作用,类胡萝卜素合成途径在这一过程中的作用很轻或者不起作用。另外,类胡萝卜素合成途径的ABA合成支路中的ABA2_b, NCED4, NCED3a和ZEP_α在花中的表达量都较高,表明ABA合成基因可能在花发育过程中有着重要功能。总体来看,这些数据使得我们能够更好地理解这些候选基因的表达模式和潜在生物学功能。7.利用MISA工具,我们在云南山茶的25,188个Unigene中找到40,823个EST-SSRo我们开发了一个新的生物信息流程CandiSSR,能快速有效地在多个物种或个体的转录组或基因组序列中鉴定多态性的SSR。利用CandiSSR,我们在云南山茶及其近缘种中鉴定出835个同时具有种间、种内多态性的SSR。总而言之,本研究构建的转录组序列大大地增加了云南山茶公共数据库中可用的遗传信息资源。这些数据为在云南山茶中开发EST-SSR标记以及研究与油脂合成、光周期诱导、类黄酮生物合成、类胡萝卜素生物合成等途径相关的重要功能基因奠定了基础。本研究中的大量数据和成果将进一步促进云南山茶的功能基因组学、群体遗传学和遗传育种研究。