论文部分内容阅读
种间杂交拓展了作物的遗传多样性并改良了关键性状。栽培陆地棉(Upland cotton)是全世界最重要的经济作物之一,是纺织工业主要的天然纤维原料。理解外源渐渗在陆地棉生态适应性和纤维品质等性状形成和改良过程中的作用,对辅助当前陆地棉育种工作具有重要的理论指导意义。本研究以两个陆地棉种质群体为研究对象,通过系统地解析遗传多样性和群体结构特征,结合外源渐渗片段分析和关联分析结果,从全基因组层面揭示了外源渐渗对栽培陆地棉亚群分化和纤维品质性状改良的影响。主要结果如下:
利用RAD-seq简化基因组测序对582份四倍体棉进行遗传多样性和群体结构分析发现,半野生棉群体的遗传多样性(π=0.041×10-3)要高于栽培种群体(π=0.022×10-3)。半野生棉群体内部基因型混杂,与先前划分的7个地理种系并不吻合。虽然栽培陆地棉内部遗传多样性整体偏低,但可以明显划分出2个亚群。其中亚群Group-2的品种主要来自较高纬度地区,具有明显的早熟特征。而亚群Group-1的材料则主要来自较低纬度地区。通过比较亚群之间的序列差异,发现Group-1和Group-2两个亚群的分化分别是由A08和A06两条染色体上大范围的的单体型多样性造成。全基因组关联分析(genome-wideassociation study,GWAS)确认了A06染色体变异区间中存在与生育期密切关联的位点。因此,推测这两条染色体的大规模变异可能与陆地棉的生态适应性形成有关。
基因型分析发现A06和A08染色体上全部已知单体型均在半野生棉中形成,而这些单体型则可能通过两种模式遗传给栽培陆地棉:(1)不同的单体型独立遗传给不同的栽培陆地棉祖先;(2)某一种单体型遗传给一种栽培陆地棉祖先,而其他单体型则是后期通过人为(或天然)杂交从半野生棉渐渗到栽培种中。随着我国棉花栽培区域整体向新疆转移,保持陆地棉栽培种内A06和A08染色体的多态性将有利于保存陆地棉种质广泛的环境适应性,同时为进一步鉴定和克隆适应性基因提供了理论依据。
对1245份栽培陆地棉8个环境纤维品质数据进行关联分析,分别鉴定到4个与纤维长度(FL2、FL3、FL4和FL5)、3个与纤维强度(FS1、FS2和FS3)和3个与纤维伸长率(FE1、FE2和FE3)相关的位点。其中FL3和FS2,以及FL5和FS1是同时调控纤维长度和纤维强度的一因多效位点(称为FL3/FS2,FL5/FS1)。在这些位点中,FL3/FS2、FL4和FS3为本研究首次报道。在群体中分布频率最高的是FL2(>75%),FL4和FL5/FS1分布频率均低于25%,而FL3/FS2和FS3的频率更低(<10%)。低频的优异等位变异普遍对性状有更高的改良效应,如FL3/FS2对纤维长度和纤维强度的改良效应达到15%,而FL2对纤维长度的改良效应仅为4.3%。该结果表明,由于绝大部分陆地棉种质仅携带FL2位点的优异等位变异,而改良效应更高的FL3/FS2仅存在于少量优质渐渗系材料中,从而导致陆地棉优质育种缺乏可利用的基因资源,造成了目前陆地棉纤维品质的改良瓶颈。
通过系统分析13个外源棉种在2927份陆地棉种质资源中的渐渗事件发现,在陆地棉中累积渐渗片段最多的3个棉种分别是四倍体海岛棉(G. barbadense)、二倍体亚洲棉(G. arboreum)和瑟伯氏棉(G. thurberi)。该结果与陆地棉远缘杂交历史记载吻合,即海岛棉和源自“陆地棉-瑟伯氏棉-亚洲棉”三元杂交种的PeeDee系列种质可能是陆地棉纤维品质改良关键的外部基因源。结合纤维品质的全基因组关联分析结果发现,陆地棉纤维品质优异等位变异来源广泛。其中控制纤维长度的FL2和同时控制纤维长度和纤维强度的FL5/FS1,以及控制纤维伸长率的全部三个优异等位变异(FE1、FE2和FE3)片段均直接来源自半野生棉;控制纤维长度的FL4可能是一个发生在基因NAC029(A10G233100)外显子上引入终止密码子的单碱基突变,该突变发生在栽培陆地棉群体;而两个具有较大纤维品质改良效应的优异等位变异FL3/FS2和FS3则分别来源自亚洲棉和瑟伯氏棉渐渗。本研究还发现,虽然栽培陆地棉基因组上存在大量的海岛棉渐渗片段,但上述优异等位变异均不是源自海岛棉。推测远缘杂交导入了大量的海岛棉片段到栽培陆地棉基因组中,然而可能仅有少量优质纤维品种存在海岛棉优异等位变异。
优异等位变异的聚合效应分析表明,凡是携带了FL3/FS2和FS3的材料纤维长度和强度均显著优于其他材料。因此我们提出这两个新鉴定到的优异等位变异可能是突破目前陆地棉纤维品质改良瓶颈的关键。然而由于远缘杂交普遍造成的连锁累赘(linkage drag)效应,且这两个位点所在的染色体区间范围较大,导致携带这些优异等位变异的材料在产量和生育期方面存在劣势。未来不仅需要通过大群体精细定位明确这些位点的关键变异和基因(causal variations/genes),打破不利连锁。还需要对陆地棉其他关键性状进行深入剖析,通过整体分析目标性状的聚合效应,筛选出品质、产量和适应性兼顾的优异等位变异组合用于指导棉花分子育种。
利用RAD-seq简化基因组测序对582份四倍体棉进行遗传多样性和群体结构分析发现,半野生棉群体的遗传多样性(π=0.041×10-3)要高于栽培种群体(π=0.022×10-3)。半野生棉群体内部基因型混杂,与先前划分的7个地理种系并不吻合。虽然栽培陆地棉内部遗传多样性整体偏低,但可以明显划分出2个亚群。其中亚群Group-2的品种主要来自较高纬度地区,具有明显的早熟特征。而亚群Group-1的材料则主要来自较低纬度地区。通过比较亚群之间的序列差异,发现Group-1和Group-2两个亚群的分化分别是由A08和A06两条染色体上大范围的的单体型多样性造成。全基因组关联分析(genome-wideassociation study,GWAS)确认了A06染色体变异区间中存在与生育期密切关联的位点。因此,推测这两条染色体的大规模变异可能与陆地棉的生态适应性形成有关。
基因型分析发现A06和A08染色体上全部已知单体型均在半野生棉中形成,而这些单体型则可能通过两种模式遗传给栽培陆地棉:(1)不同的单体型独立遗传给不同的栽培陆地棉祖先;(2)某一种单体型遗传给一种栽培陆地棉祖先,而其他单体型则是后期通过人为(或天然)杂交从半野生棉渐渗到栽培种中。随着我国棉花栽培区域整体向新疆转移,保持陆地棉栽培种内A06和A08染色体的多态性将有利于保存陆地棉种质广泛的环境适应性,同时为进一步鉴定和克隆适应性基因提供了理论依据。
对1245份栽培陆地棉8个环境纤维品质数据进行关联分析,分别鉴定到4个与纤维长度(FL2、FL3、FL4和FL5)、3个与纤维强度(FS1、FS2和FS3)和3个与纤维伸长率(FE1、FE2和FE3)相关的位点。其中FL3和FS2,以及FL5和FS1是同时调控纤维长度和纤维强度的一因多效位点(称为FL3/FS2,FL5/FS1)。在这些位点中,FL3/FS2、FL4和FS3为本研究首次报道。在群体中分布频率最高的是FL2(>75%),FL4和FL5/FS1分布频率均低于25%,而FL3/FS2和FS3的频率更低(<10%)。低频的优异等位变异普遍对性状有更高的改良效应,如FL3/FS2对纤维长度和纤维强度的改良效应达到15%,而FL2对纤维长度的改良效应仅为4.3%。该结果表明,由于绝大部分陆地棉种质仅携带FL2位点的优异等位变异,而改良效应更高的FL3/FS2仅存在于少量优质渐渗系材料中,从而导致陆地棉优质育种缺乏可利用的基因资源,造成了目前陆地棉纤维品质的改良瓶颈。
通过系统分析13个外源棉种在2927份陆地棉种质资源中的渐渗事件发现,在陆地棉中累积渐渗片段最多的3个棉种分别是四倍体海岛棉(G. barbadense)、二倍体亚洲棉(G. arboreum)和瑟伯氏棉(G. thurberi)。该结果与陆地棉远缘杂交历史记载吻合,即海岛棉和源自“陆地棉-瑟伯氏棉-亚洲棉”三元杂交种的PeeDee系列种质可能是陆地棉纤维品质改良关键的外部基因源。结合纤维品质的全基因组关联分析结果发现,陆地棉纤维品质优异等位变异来源广泛。其中控制纤维长度的FL2和同时控制纤维长度和纤维强度的FL5/FS1,以及控制纤维伸长率的全部三个优异等位变异(FE1、FE2和FE3)片段均直接来源自半野生棉;控制纤维长度的FL4可能是一个发生在基因NAC029(A10G233100)外显子上引入终止密码子的单碱基突变,该突变发生在栽培陆地棉群体;而两个具有较大纤维品质改良效应的优异等位变异FL3/FS2和FS3则分别来源自亚洲棉和瑟伯氏棉渐渗。本研究还发现,虽然栽培陆地棉基因组上存在大量的海岛棉渐渗片段,但上述优异等位变异均不是源自海岛棉。推测远缘杂交导入了大量的海岛棉片段到栽培陆地棉基因组中,然而可能仅有少量优质纤维品种存在海岛棉优异等位变异。
优异等位变异的聚合效应分析表明,凡是携带了FL3/FS2和FS3的材料纤维长度和强度均显著优于其他材料。因此我们提出这两个新鉴定到的优异等位变异可能是突破目前陆地棉纤维品质改良瓶颈的关键。然而由于远缘杂交普遍造成的连锁累赘(linkage drag)效应,且这两个位点所在的染色体区间范围较大,导致携带这些优异等位变异的材料在产量和生育期方面存在劣势。未来不仅需要通过大群体精细定位明确这些位点的关键变异和基因(causal variations/genes),打破不利连锁。还需要对陆地棉其他关键性状进行深入剖析,通过整体分析目标性状的聚合效应,筛选出品质、产量和适应性兼顾的优异等位变异组合用于指导棉花分子育种。