论文部分内容阅读
当归(Angelica sinensis(Oliv.))属伞形科(Umbelliferae)当归属(Angelica)两年生草本植物,早期抽薹开花严重影响当归产量和质量。目前,利用分子遗传机理对当归早期抽薹开花的研究尚未见报道,且调节其早期开花的主效基因也不明确。鉴于此,本研究利用转录组测序技术对连续五代抽薹当归不同组织进行测序,通过同源比对策略寻找差异表达基因,筛选出调控当归早期抽薹开花的候选基因,并分离克隆了当归的AP1、AGL9同源基因。然后,利用生物信息学在线分析工具,对AsAP1、AsAGL9同源基因进行了理化性质、保守结构域、疏水性、跨膜区及功能预测分析,旨在为调控当归早期开花基因的挖掘和研究提供理论依据。主要研究结果如下:
⑴利用RNA-seq技术对当归4种组织进行测序,得到190388594个Reads,利用Trinity软件生成366738个Contigs,通过鉴定得到113573个Unigenes,平均长度为1068nt,N50长度为1802nt;将拼接的Unigenes通过与Nr、Nt、Swissprot、KEGG数据库、KOG数据库、Interpro蛋白数据库、GO数据库、Intersection数据库、Overall蛋白数据库进行比对,分别预测了71024、59931、49694、51832、55320、46908、35598、17133、79161个蛋白,分别占总量的62.54%、52.75%、43.76%、45.64%、48.71%、41.30%、31.34%、15.09%、69.70%;通过对总长度121248332bp的113573条Unigene进行分析,确定到17797个微卫星位点,含有序列的SSR有14181个,占比79.68%。
⑵首先,通过对转录组数据的同源蛋白序列比对发现,当归的蛋白与同科植物胡萝卜的同源性最高,其次是葡萄和水稻;然后,通过与NCBI中已验证功能的开花基因序列比对得到相对应的同源序列,发现当归早期开花涉及5条开花途径:光周期途径、春化途径、赤霉素途径、自主途径和温度途径,7个开花整合因子AP1、AGL6、AGL9、FLC、LFY、SOC1、FT;最后,对上述筛选出的92个同源基因进行差异表达分析,以在种子中表达量上调为依据,发现2个unigenes在种子中显著表达,其中AP1基因同源序列Unigene45683_All在根、叶中不表达,与茎相比,在种子中的表达量明显上调11.0倍;AGL9同源序列Unigene46836_All在种子中表达量高达109.88,而在其它组织中不表达。
⑶根据转录组测序结果来设计引物,克隆出AsAP1和AsAGL9基因。AsAP1基因cDNA全长957bp,编码244个氨基酸,利用ExPaSy-Protparam软件分析结果显示分子量为80428.66Da,等电点5.05,不稳定指数为41.92,脂肪指数为22.88,亲水性系数为-0.633,说明AsAP1蛋白具备亲水性功能;根据SOPMA软件分析得到AsAP1基因的二级结构包括α-螺旋(52.05%)、不规则盘绕(37.30%)和延伸链(10.66%);使用TMHMM-2.0软件分析显示AsAP1蛋白质不通过跨膜区并作用于膜外。通过系统进化树分析发现AsAP1蛋白与胡萝卜、葡萄、水稻等物种中调控开花时间相关的AP1转录因子聚为一类,与同科植物胡萝卜AP1的同源基因(GeneID:108200812)相似度高达98%,说明AsAP1与AP1转录因子同源。氨基酸比对显示AsAP1蛋白与胡萝卜控制早期抽薹性状主效基因AP1蛋白都含有MADS超基因家族的保守区:MEF_LIKE_2和属于K-box超基因家族的保守区K-box,由此推测AsAP1很有可能也是一个具有调控开花时间的功能基因。
⑷AsAGL9基因CDNA全长1009bp,编码250个氨基酸,利用ExPaSy-Protparam软件分析结果显示分子量为82333.34Da,等电点5.06,不稳定指数为46.75,脂肪指数为28.05,亲水性系数为-0.322,说明AsAGL9蛋白具备亲水性功能;根据SOPMA软件分析得到AsAGL9基因的二级结构包括α-螺旋(57.60%)、不规则盘绕(34.00%)和延伸链(8.40%)。使用TMHMM-2.0软件分析显示AsAGL9蛋白质不通过跨膜区并作用于膜外。通过氨基酸序列比对表明,AGL9基因在不同品种植物间具有保守性,但都具有控制开花时间的MADS_MEF_like2、MADS_domain、K-box结构域,只是在个别位点存在突变,说明AGL9基因也极有可能是控制开花的候选基因。通过构建系统发育树发现:AsAGL9与其他物种中调控开花时间MADS-Box转录因子AsAGL9聚为一枝,基本可以确定AsAGL9是一种与开花相关MADS-Box转录因子;植物AGL9基因的同源性基本反应了物种间的亲缘关系,同时还发现,AGL9基因在木本植物和非木本植物间也存在分化,说明在植物进化过程中,AGL9基因在保留基本结构的基础上,为了更好的适应外界复杂的环境变化而进化。
⑴利用RNA-seq技术对当归4种组织进行测序,得到190388594个Reads,利用Trinity软件生成366738个Contigs,通过鉴定得到113573个Unigenes,平均长度为1068nt,N50长度为1802nt;将拼接的Unigenes通过与Nr、Nt、Swissprot、KEGG数据库、KOG数据库、Interpro蛋白数据库、GO数据库、Intersection数据库、Overall蛋白数据库进行比对,分别预测了71024、59931、49694、51832、55320、46908、35598、17133、79161个蛋白,分别占总量的62.54%、52.75%、43.76%、45.64%、48.71%、41.30%、31.34%、15.09%、69.70%;通过对总长度121248332bp的113573条Unigene进行分析,确定到17797个微卫星位点,含有序列的SSR有14181个,占比79.68%。
⑵首先,通过对转录组数据的同源蛋白序列比对发现,当归的蛋白与同科植物胡萝卜的同源性最高,其次是葡萄和水稻;然后,通过与NCBI中已验证功能的开花基因序列比对得到相对应的同源序列,发现当归早期开花涉及5条开花途径:光周期途径、春化途径、赤霉素途径、自主途径和温度途径,7个开花整合因子AP1、AGL6、AGL9、FLC、LFY、SOC1、FT;最后,对上述筛选出的92个同源基因进行差异表达分析,以在种子中表达量上调为依据,发现2个unigenes在种子中显著表达,其中AP1基因同源序列Unigene45683_All在根、叶中不表达,与茎相比,在种子中的表达量明显上调11.0倍;AGL9同源序列Unigene46836_All在种子中表达量高达109.88,而在其它组织中不表达。
⑶根据转录组测序结果来设计引物,克隆出AsAP1和AsAGL9基因。AsAP1基因cDNA全长957bp,编码244个氨基酸,利用ExPaSy-Protparam软件分析结果显示分子量为80428.66Da,等电点5.05,不稳定指数为41.92,脂肪指数为22.88,亲水性系数为-0.633,说明AsAP1蛋白具备亲水性功能;根据SOPMA软件分析得到AsAP1基因的二级结构包括α-螺旋(52.05%)、不规则盘绕(37.30%)和延伸链(10.66%);使用TMHMM-2.0软件分析显示AsAP1蛋白质不通过跨膜区并作用于膜外。通过系统进化树分析发现AsAP1蛋白与胡萝卜、葡萄、水稻等物种中调控开花时间相关的AP1转录因子聚为一类,与同科植物胡萝卜AP1的同源基因(GeneID:108200812)相似度高达98%,说明AsAP1与AP1转录因子同源。氨基酸比对显示AsAP1蛋白与胡萝卜控制早期抽薹性状主效基因AP1蛋白都含有MADS超基因家族的保守区:MEF_LIKE_2和属于K-box超基因家族的保守区K-box,由此推测AsAP1很有可能也是一个具有调控开花时间的功能基因。
⑷AsAGL9基因CDNA全长1009bp,编码250个氨基酸,利用ExPaSy-Protparam软件分析结果显示分子量为82333.34Da,等电点5.06,不稳定指数为46.75,脂肪指数为28.05,亲水性系数为-0.322,说明AsAGL9蛋白具备亲水性功能;根据SOPMA软件分析得到AsAGL9基因的二级结构包括α-螺旋(57.60%)、不规则盘绕(34.00%)和延伸链(8.40%)。使用TMHMM-2.0软件分析显示AsAGL9蛋白质不通过跨膜区并作用于膜外。通过氨基酸序列比对表明,AGL9基因在不同品种植物间具有保守性,但都具有控制开花时间的MADS_MEF_like2、MADS_domain、K-box结构域,只是在个别位点存在突变,说明AGL9基因也极有可能是控制开花的候选基因。通过构建系统发育树发现:AsAGL9与其他物种中调控开花时间MADS-Box转录因子AsAGL9聚为一枝,基本可以确定AsAGL9是一种与开花相关MADS-Box转录因子;植物AGL9基因的同源性基本反应了物种间的亲缘关系,同时还发现,AGL9基因在木本植物和非木本植物间也存在分化,说明在植物进化过程中,AGL9基因在保留基本结构的基础上,为了更好的适应外界复杂的环境变化而进化。