论文部分内容阅读
花色是被子植物非常重要的性状,它常常被认为与吸引昆虫传粉有关。在自然界中,大约88%的被子植物的花色色素是花青素:天竺葵素(pelargonin)、矢车菊素(cyanidin)、飞燕草素(delphinidin)类。除花青素苷外,黄酮醇苷、原花青素-缩合单宁是另两大类类黄酮物质。各种类黄酮物质参与决定植物的器官色彩、异花授粉、抗紫外线、抗虫防病、抗冷等多种生理功能,而且各种类黄酮物质在人体内普遍具有抗氧化、清除自由基、防癌、抗炎等多种保健功效。因此,对类黄酮生物合成途径系统发育的研究,有助于我们更加全面和本质性地理解该途径和相关性状的分子进化机理和模式,更好地推动该途径进化、基因功能研究、蛋白进化研究等基础理论研究,也有助于为该途径分子设计、代谢工程等应用研究提供指导或参考。本文利用JGI (DOE Join Gemone Institute)数据库中已经进行全基因组测序的23种植物的类黄酮生物合成途径9大关键酶为主要研究范围,下载它们的已注释CDS序列和已注释Protein序列用于构建Blast数据库。通过双向Blast对CDS序列提取;通过InterProScan进行结构域检测;利用R语言进行同源基因拷贝数统计和分类分析;利用ClustalO对多个数据集的序列差异分析;利用ProtTes、Phylip和PhyML进行系统发育树重建;使用PAML进行分支和位点的选择压力分析;使用CodonW密码子偏爱性分析;使用EMBOSS、SignalP、Wolf PSort进行蛋白质理化性质分析;综合所有信息和结果进行整体分析,得出以下结论:1、上游类黄酮基因的旁系同源基因之间已显著歧化和分型,并具有植物类群特征。通过对比直系同源基因的比对结果和同源基因的比对结果。我们发现直系同源基因比对结果表现出序列稳定,但旁系同源基因的比对结果表现出序列混乱,并且这种混乱在上游基因体现得较为明显,而这些同源基因又可以通过严格的双向Blast提取出来。因此,我们认为类黄酮生物合成途径上游基因在不同的物种分类之间表现出歧化现象,说明这些基因的祖先在大量加倍之后,伴随物种分化进入不同物种(祖先),再在这些新的物种中各自进化。即上游类黄酮基因的旁系同源基因之间已显著歧化和分型,并具有植物类群特征。2、CHS拷贝数高的物种,F3H的拷贝数可能也高。通过基因拷贝数的统计,我们发现:在蔷薇科、豆科中,CHS拷贝数高的同时,F3H也高;而禾本科中不仅在CHS拷贝数高的同时F3H也高,而且ANR也高。值得一提的是,这种现象不仅只是科、属这些分类级别的统计结果,在这些分类内部的每个物种也可以观察到这种现象。3、不同科物种的类黄酮生物合成途径的密码子偏爱性有很大差异。我们在密码子偏爱性分析中发现单双子叶植物的密码子偏爱性有巨大差异。从统计结果来看,双子叶植物的密码子第三位偏向于AT,而单子叶植物偏向于GC,并且单子叶植物密码子的GC与AT的比值大于10。同时,我们还发现,双子叶植物密码子第三位偏向于AT其实很大程度上是因为豆科植物,像十字花科、蔷薇科之类的物种,它们的密码子第三位其实也偏向于GC,但这种偏爱性并不明显——GC与AT的比值看起来更加接近于没有偏爱性。4、不同科物种的类黄酮生物合成途径基因的GC含量有很大差异1)禾本科植物所有位点的GC含量较高,这与其密码子第三位的GC含量一致;2)豆科植物每个位点的GC含量相差不大,在整个代谢途径上体现出GC含量的稳定性;3)云薹属植物的GC含量在代谢途径上游的位点较高,而在下游位点相对较低;4)在双子叶植物中,就整个代谢途径而言,蔷薇科植物位点的GC含量略高,但均比单子叶植物的禾本科低。5、单一位点的分子进化无法代表其所在的代谢途径的进化,单一代谢途径的进化无法代表整个物种的进化。通过人工微染色体与物种之间、位点与物种之间的系统发育比较后,我们认为:单一的分子进化无法代表其所在的代谢途径的进化,甚至会出现相悖的现象,哪怕是此代谢途径中最关键、最核心的位点;同样的,单一代谢途径的进化无法代表整个物种的进化,也可能出现相悖的现象,哪怕是此物种中最经典、最具代表性的代谢途径。