论文部分内容阅读
萜类化合物是一类在植物、细菌及真菌中普遍存在的天然产物,有重要的生理、生态作用及药用价值。萜类化合物以异戊二烯(C5)为结构单元,根据结构单位数的不同将萜类化合物分为单萜、倍半萜、二萜等。萜类化合物的合成途径复杂,需要多种酶的共同参与及协调作用。异戊烯转移酶催化C5前体生成C10、C15、C20等异戊烯焦磷酸中间体。萜类合成酶作为萜类化合物合成的关键酶,催化这些中间体生成相应的单萜、倍半萜和二萜等。部分萜类物质还需要在细胞色素P450的修饰下生成具有特定功能的萜类化合物。火炬松是美国南方松中最重要的速生针叶用材树种,属于裸子植物松属,具有重要的经济价值与生态作用。由于松属基因组非常大且极其复杂,基因组测序工作是一项非常大的挑战。2014年加州大学科学家带领研究小组完成了火炬松基因组测序工作,在已测序的物种中火炬松的基因组最大。目前萜类合成途径中相关酶的研究大多集中在被子植物中,而裸子植物中研究较少。为了系统的探究裸子植物萜类合成途径相关酶,本研究选取裸子植物代表物种火炬松为研究对象利用生物信息学方法在火炬松全基因组范围内对萜类合成途径相关酶进行预测和鉴定,并对其蛋白特征序列、启动子、基因结构、表达谱、系统进化和功能相关性等进行分析,研究结果表明:1.MVA和MEP途径中各类酶的识别与分析。基于隐马尔可夫预测模型和BLAST分析,本研究在火炬松中鉴定了与前体IPP和DMAPP合成相关的酶全长基因:MEP途径中的MCT、CMK、MDS、HDR、DXR均只有1个基因,HDS有4个基因,DXS有3个基因;MVA途径中除MVD和PMK只有1个基因外,AACT有4个基因,HMGS有3个基因,HMGR有43个基因。IDI有7个基因。相比于拟南芥萜类合成相关酶,MVA途径中HMGR基因数目变化极大,通过分析水稻、高粱、杨树和玉米HMGR基因,发现HMGR基因数目与物种的基因组大小成正相关。2.异戊烯转移酶的识别与功能分析。在火炬松中共鉴定了以下4类全长的异戊烯转移酶FPS、GPS、GFPPS、GGPS,其中1个FPS基因,1个GPS基因,2个GFPPS基因,23个GGPS基因。进化分析发现,这4类异戊烯转移酶由于序列的差异及功能的分化在进化树上形成明显的3个进化支,FPS和GPS分别形成独立的进化支,GFPPS和GGPS形成一个进化支。火炬松异戊烯转移酶与其他物种中已注释的异戊烯转移酶构建相似性网络,该网络由507个节点和1692条边关系组成,形成分别以火炬松FPS、GPS、GGPS和GFPPS为中心的子网络,根据相似性网络推测出火炬松异戊烯转移酶的功能。3.TPS基因家族的识别与功能分析。基于隐马尔可夫检索模型在火炬松中共预测了 68个全长TPS基因。相比被子植物火炬松TPS在进化过程中发生了大量的扩增,并形成区别于被子植物TPS分类的TPS-d家族。分析序列特征发现火炬松中TPS仍然含有被子植物TPS中经典的特征序列DDXXD。基因结构分析结果显示火炬松TPS基因含大量长内含子,最长的内含子约25kb。对TPS进化分析显示火炬松TPS分为TPS-d1、TPS-d2和TPS-d3三个亚家族,根据系统进化树预测部分火炬松TPS的功能。启动子分析发现在火炬松TPS基因的启动子中共发现了 110种顺式作用元件。火炬松TPS与其他物种中已注释的TPS构建相似性网络,该网络465个节点和6796条边关系组成,根据相似性网络推测部分TPS的功能。4.P450基因家族的识别与分析。在火炬松中预测了 257个P450基因,这些P450基因分为35个家族,其中A型P450有15个基因家族共161个基因,非A型P450有20个基因家族共96个基因。被子植物与裸子植物分化前的P450即CYP73、CYP78和CYP98家族成员数目在火炬松与被子植物中一致。5.萜类合成途径相关酶的功能相关性分析。萜类合成途径相关酶基因构建共表达网络,该网络共446个节点,4992条边关系,每个节点代表一个基因,每条边代表基因间表达的相关性。根据共表达网络分析共发现了 2组萜类化合物合成途径中彼此关联的基因:(A)HMGS、HMGR、GGPS、TPS、P450,推测出该组关联基因的功能可能与二萜化合物的合成相关。(B)HMGS、HMGR、PMK、IDI、FPS、TPS、P450,推测出该组关联基因的功能可能与倍半萜化合物的合成相关。结论:本研究在火炬松全基因组范围内系统的识别了萜类合成途径中PT、TPS和P450等酶,对这些酶进行了深入的生物信息学分析,并根据系统进化及相似性网络对这些酶的功能进行预测,最后通过共表达网络分析识别萜类化合物合成途径中上下游互相协作的功能相关酶基因,将为萜类合成途径相关酶基因的功能研究及应用提供重要的理论基础。