论文部分内容阅读
EGCG(表没食子儿茶素没食子酸酯)是茶叶中关键的生理活性成分之一,茶树(Camellia sinensis)是其在生物界中的唯一来源。分析筛选与茶树EGCG生物合成有关的关键候选结构基因和调节基因,将为我们以后运用分子生物学方法提高茶树EGCG含量的研究奠定理论基础。本试验应用Illumina HiSeqTM2000高通量测序平台的转录组测序技术,通过分析高EGCG含量的“1005”茶树新品系及其父母木的转录组在不同发育时期基因表达谱的差异变化,结合EGCG含量变化趋势分析筛选出决定茶树EGCG生物合成的关键候选基因,主要研究结果如下:(1)应用转录组测序技术对“1005”茶树新品系及其父母本不同发育时期的9个样本进行测序。测序共获得Clean reads 47.08G,各个样本含量如下:M0(4.38G),M2(5.10G),M4(5.90G),F0(5.82G),F2(5.68G),F4(5.68G),E0(5.34G),E2(4.56G),E4(4.62G);9个样本的Clean reads比率均达到96%以上,未知碱基N的含量均低于0.5%;Q20均在95%以上;GC含量均在40%-50%之间。(2)运用生物信息学手段进行组装和拼接共获得130762条All-Unigene,约84.2Mb,平均长度为644bp,N50长度为963bp。其中长度在200-500bp之间的Unigene所占比例最大,达到65%;长度在1000bp以上的Unigene比例达到16%。(3)All-Unigene通过与NR、NT、SwissProt、GO、KOG和KEGG等数据库做BlastX比对(Evalue<10-5),并对其进行功能注释。结果发现至少在一个数据库中被注释到的基因有49528(37.87%)条;通过GO功能分类,有33938条基因被注释到55种功能类别中,参与细胞过程、代谢过程、结合及催化活性的基因较多;通过KOG功能分类,有13861条基因被注释到26类功能类别中,参与转录、信号转导及翻译后修饰的基因最多,达到4236(27.22%)条;通过KEGG代谢通路分析,共有9520条基因注释到5个分支31个Pathways中,位于前3位的依次是翻译、碳水化合物代谢和能量代谢,此外有265(2.57%)条基因位于D类次级代谢产物合成,其中有49条基因参与类黄酮生物合成。(4)根据转录组数据和EGCG及儿茶素成分含量,分析筛选得到1个基因comp153174_c0(F3’5’H)可作为EGCG生物合成的关键候选结构基因;分析筛选得到 2 个 MYB 基因 comp143073_c0、comp166178_c0 和 1 个 bHLH 基因comp159534_c2可作为EGCG生物合成的关键候选调节基因。(5)根据基因在高EGCG含量的“1005”茶树新品系及其父母本不同发育时期的9个样本中的RPKM值与相应的儿茶素含量进行关联性分析。数据统计软件表明关键候选基因 comp153174_c0(F3’5’H)、comp143073_c0(MYB)、comp166178_c0(MYB)、comp159534_c2(bHLH)与 EGCG 含量关联系数分别为0.6463、0.8579、0.7532、0.7692,与EGCG含量关联系数绝对值在对应类中由大到小排序分别位列第1、第1、第7、第4。