论文部分内容阅读
大麦(Hordeum vulgare L.)是最重要的谷类作物之一,其年产量及种植面积均具世界第四位,兼具食用、饲用及酿造价值,对保障粮食安全和社会经济发展具有重要意义。同时,大麦也是最古老、最早被人类驯化栽培的作物之一,考古学和分子生物学证据表明,最早的栽培大麦可溯源到公元前10,000年的新月沃土地区,该地区广泛分布着环境可塑性强、变异类型众多、遗传多样性丰富的大麦野生种质资源。因此,大麦也成为研究作物起源进化、人工驯化选择乃至农业栽培和人类文明发展史的理想模式系统。随着高通量测序技术的发展以及生信分析工具的完善,大麦高质量的全基因组序列精细图已经完成,这为大麦的群体遗传学及基因组学研究带来新的契机。本研究以不同大麦起源地的野生大麦及世界主要栽培大麦品种为材料,利用ISJ和SSR分子标记,结合全基因组重测序分析、转录组测序及叶绿体基因组序列,全面分析了野生大麦和栽培大麦的遗传多样性、遗传分化、系统进化关系和群体遗传结构,比较了不同地理生态型野生大麦间的遗传变异及单倍型分布,从多个层次探究了大麦在驯化过程中承受的选择的基因组区域及相关基因,并初步分析了选择的遗传学效应。最后,以MAPK级联途径基因家族为例,分析了大麦驯化相关基因家族的基因组组成、分布、表达特性等,为进一步研究其生物学功能奠定了基础。主要研究结果如下:(1)基于ISJ和SSR分子标记的大麦遗传多样性分析以全世界不同来源地的55份栽培大麦材料和89份野生大麦材料(4个群体)为研究材料,利用ISJ和SSR两类分子标记对大麦的遗传多样性、群体结构和遗传分化进行了初步研究。结果发现,大麦具有较高的遗传多样性,共检测到162个ISJ和196个SSR多态性条带;群体结构分析明显地将野生和栽培材料聚为两个分支,野生材料又可进一步细分为4个亚群,每一个亚群基本与其采样来源地分布一致;遗传多样性分析发现,野生群体Mount Gilboa拥有的遗传多样性指数最高(Na=3.944),而栽培大麦的多样性较低(Na=3.861),表明大麦在驯化过程中承受了较为严苛的人工选择压力,致使等位基因缺失,遗传多样性下降。(2)基于全基因组重测序的大麦遗传多样性、群体结构与人工选择效应分析为进一步探究栽培大麦和野生大麦的驯化痕迹和选择效应,本研究利用全基因组重测序技术对代表性的40份野生大麦和22份栽培大麦进行了全基因组重测序分析。以最新的大麦参考基因组为参照,共检测到107.12×10~6单核苷酸多态性(SNPs)和6.65×10~6个插入/缺失(InDels)变异位点,且这些变异比较均匀地分布于7个染色体;系统进化、主成分以及群体结构分析可将野生和栽培材料划分为两大类群,依据生态型或者地理来源可将野生大麦分为不同的亚群;与野生大麦相比,栽培材料的遗传多样性大约低38%,暗示在驯化过程中,由于遗传瓶颈效应,栽培大麦遗传多样性明显下降;进一步种群动态分析发现,人工选择效应塑造了野生与栽培大麦不同的种群动态发展模式;最后,通过全基因组扫描分析,共鉴定到了2,470个受选择基因,功能富集发现这些基因与大麦生长发育,激素相应,生物钟,生物胁迫及非生物胁迫相关,该研究为进一步从性状建成和基因功能角度阐明大麦的驯化选择效应提供了重要信息,为大麦全基因组水平的起源、进化和选择研究提供的宝贵资源。(3)野生和栽培大麦的叶绿体比较基因组学分析叶绿体序列是研究植物系统进化和物种鉴定的重要工具。本研究利用大麦全基因组重测序数据,利用自己搭建的分析流程,组装、获得了38个野生和18个栽培大麦的叶绿体全基因组序列。全基因组比对分析共鉴定到188个SNPs和108个InDels,平均为1.38个SNP/kb及0.41个In Del/kb;遗传多样性分析发现野生材料的遗传多样性高于栽培材料,这与核基因组的研究结果一致;同时,17个变异位点在野生和栽培材料中呈现不同的单倍型,将野生和栽培大麦区分开,可作为潜在的大麦鉴定的标记位点,其中7个为影响水平中等的基因内变异位点,2个影响水平中等的内含子区域变异以及8个低影响的同义突变;群体结构分析也将野生和栽培材料聚为两个分支,野生材料又可依据地理来源分为不同亚组;系统进化分析发现,叶绿体基因组与重测序的进化树拓扑结构不完全一致,暗示了两套基因组之间存在进化速率上的差异。最后我们探究了遗传距离与物理距离之间的相关性,结果发现物理距离每增加798.85公里,遗传距离增加0.1。这为利用叶绿体基因组测序探究大麦的群体结构和系统进化关系提供了重要信息,也为大麦叶绿体基因组进化研究提供了参考。(4)栽培大麦和野生大麦的群体转录组研究群体转录组测序为在转录层次开展遗传分化和比较分析提供了重要手段。本研究以26份栽培大麦和29份野生大麦为材料,进行了群体比较转录组分析。结果共鉴定到了12.6×10~6个SNP位点,将其与基因组发掘的SNP变异进行比较,发现两种测序结果得到的数据具有较高的一致性,互为验证。利用SNP进行群体结构分析发现野生和栽培材料分为两个组别。差异基因分析鉴定到395在栽培和野生大麦间显著差异表达的基因,这些基因的功能在ncRNA代谢过程、tRNA代谢过程、蛋白质翻译的tRNA氨酰化、连接酶活性、氨酰-tRNA连接酶活性、连接酶活性、细胞质组成、叶绿体组成等过程显著富集,该研究为进一步开展大麦驯化生物学研究提供了候选。(5)大麦MAPK级联途径基因家族的鉴定、表达特性及共表达网络分析结合基因组和转录组数据,我们发现激酶基因家族成员是大麦驯化过程受选择基因,为此我们以有丝分裂原激活蛋白激酶(MAPK)级联途径基因家族为例,对其进行了全基因组鉴定、系统进化和表达特性分析,以期为探究大麦驯化相关基因的生物学功能鉴定基础。利用最新发布大麦基因组数据,通过全基因组分析共预测、鉴定了20个MAPK、6个MAPKK和156个MAPKKK基因;系统进化树参照将所有MAPK级联途径基因分为三组,即MAPK,MAPKK和MAPKKK,MAPKKK基因家族又可进一步聚集为MEKK,RAF和ZIK亚家族;分子进化分析表明,片段和串联重复事件都是MAPK级联基因家族的扩张的动力,非同义替换(Ka)和同义替换(Ks)的比率发现复制的基因对受到了强烈的纯性选择;利用公共可获得的RNA-seq数据,对MAPK级联途径基因在植物生长和发育及生物和非生物胁迫下的表达模式进行了分析,鉴定到了63个植物组织器官、阶段特异性表达及逆境响应相关的基因;最后,使用靶基因预测工具和WGCNA方法构建了MAPK级联途径基因及其与miRNA之间的互做网络,发现由46个HvMAPK级联途径基因和11个miRNA参与的共72条互作关系。本研究首次系统全面地探究了大麦中MAPK,MAPKK和MAPKKK基因家族的特征,为阐明其在植物中的生物学作用提供宝贵的信息,并有助于更好地了解大麦种驯化相关基因的功能及参与的调控网络。