论文部分内容阅读
芝麻(Sesamum indicum L.,2n=26)属胡麻科胡麻属,是我国重要的油料作物之一。它不仅含有大量的脂肪和蛋白质,还富含各种抗氧化物质和矿物质元素,被广泛应用于食品加工、医疗保健和抗衰老等方面。本研究以选自核心种质的366份具有代表性的芝麻种质为样本,利用 SALF-seq(Specific-Locus Amplified Fragment Sequencing)技术测序获得89,924个分布于整个基因组的SNP标记,评估366份芝麻样本的群体结构、遗传多样性及连锁不平衡水平;利用44,109个SNP标记对363份芝麻样本的主要农艺性状和耐渍性状进行全基因组关联分析,发掘优异等位变异,为芝麻的种质改良和品种选育提供基础信息。具体研究内容和结果如下:1.366份芝麻样本的遗传变异分析。通过SLAF-seq方法对366份芝麻样本进行简化基因组测序并开发了 89,924个分布于整个基因组上的SNP标记,平均密度为2.67 kb/SNP;群体结构分析表明366份样本可划分为3个亚群(Pop 1、Pop 2和Mixed);主成分分析(PCA)和进化树分析结果进一步验证了 3个亚群的合理性;地理来源信息分析表明该群体的群体构成是以地理位置为基础,并含有大量的混合样本;遗传多样性分析显示样本群体及其3个亚群对应的核苷酸多样性分别是1.1×10-3、1.0× 10-4、2.7×10-4和3.6×10-4;全基因连锁不平衡(Linkage disequilibrium,LD)分析表明,群体的平均衰减距离为~99 kb,并且各连锁群之间衰减距离的变化较大。2.芝麻产量性状的表型变异分析和全基因组关联分析。7个产量相关性状(单株产量、株高、始蒴高度、蒴粒数、单株蒴数、千粒重、表观收获指数)存在较为广泛的表型变异,并表现出典型的数量性状;群体内产量相关性状的广义遗传率在49.04%(收获指数)~87.65%(始蒴高度)之间。利用44,109个SNP标记对363份芝麻样本的7个产量性状进行全基因组关联分析,检测到173个关联位点。16个位点与单株产量关联,表型变异解释率在4.14%~13.73%之间;25个位点与单株蒴数关联,表型变异解释率为3.36%~16.52%;24个位点与始蒴高度关联,表型变异解释率在3.83%~12.64%之间;30个位点与株高关联,表型变异解释率在3.30%~16.44%之间;30个位点与蒴粒数关联,表型变异解释率在3.52%~12.92%之间;32个位点与千粒重关联,表型变异解释率在4.02%~20.32%之间;16个位点与收获指数关联,表型变异解释率在4.80%~11.61%之间。合并重复位点后为136个关联位点,其中16个位点同时与2个以上性状关联。对在2个及以上环境中可重复检测到的位点和表型解释率在10%以上的位点进行候选基因筛选,以关联位点两侧99kb为候选基因检测区域,共获得642个候选基因,其中3个为产量性状的重要候选基因:SIN1006340编码转录因子bHLH93的生成,调控赤霉素的分解过程和调节生长素的合成;SIN1006338(SiACS)是芝麻每腋蒴数(1蒴或3蒴)的效应基因;SIN1014512调控生长素信号转导,抑制茎和下胚轴细胞的伸长生长。3.芝麻样本群体的籽粒颜色、种子含油量和蛋白含量的全基因组关联分析,共检测到79个关联位点。24个SNP位点与籽粒颜色关联,表型变异解释率在3.73%-1 6.93%之间;28个SNP位点与含油量关联,表型变异解释率在2.81%~11.04%之间;27个位点与蛋白含量关联,表型变异解释率在5.34%~18.09%之间。在2个及以上环境中可重复检测到的关联位点和表型解释率在10%以上的关联位点共有22个,在其候选基因区域内获得480个候选基因。其中,6个为品质性状的重要候选基因,SIN1006022和SIN1016759分别属于细胞色素P450家族基因和多酚氧化酶基因,SIN1010914为4-香豆酰辅酶A连接酶基因;SIN1010859注释为单甘油酯脂肪酶(Monoglyceride lipase);SIN1003867 注释为乙酰辅酶 A-a-转羧酶亚基(Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha-carboxyltransferase subunits);SIN1005755 注释信息为 NAC 结构域蛋白(NAC domain-containing protein 43),主要参与调节次生细胞壁的生物合成。4.芝麻群体耐渍性的鉴定及全基因组关联分析。在芝麻盛花期,对363份芝麻样本进行人工淹水胁迫试验,调查植株萎蔫率和死株率,首次将芝麻萎蔫程度细分为5个等级,计算渍害指数。利用渍害指数对363份样本进行渍害鉴定,获得2份极耐渍材料,43份耐渍材料。利用44,109个SNP标记对渍害性状进行全基因组关联分析,共检测到18个与渍害指数显著关联的SNP标记,解释2.18%~14.47%的表型变异。选取表型解释率在4%以上的13个关联位点,在关联位点两侧99kb共198kb的范围内筛选到125个候选基因。其中5个为重要候选基因,SIN1016730、SIN1016731、SIN1016732 和 SIN100947为乙烯响应转录因子(Ethylene-responsive transcription factor,ERF)家族基因,分别与拟南芥的ERF5、ERF5、ERF2和ERF2-12为同源基因;SIN1005731属于bHLH家族基因。