论文部分内容阅读
诱变来源的突变体广泛应用于大豆[Glycine max(L.)Merr.]基因功能研究以及品种选育,但在现阶段也面临三个方面的问题待改善。第一,经典的因果突变定位方法,例如混合分组分析(bulked segregant analysis,BSA),需要突变体材料经历若干世代自交或者杂交,这极大延长了因果突变定位的周期。第二,大豆突变基因的功能机制解析还缺乏可参考的先验数据库。第三,突变体的因果突变往往导致大豆生长发育缺陷,并不适合直接用于大豆育种。因此,本论文建立了突变体因果突变快速定位的新方法,极大缩短了大豆突变体功能基因的克隆周期;构建了大豆基因表达调控网络,为目标基因功能机制解析提供直接的线索,从而为后续的分子实验验证提供先验信息;证明基于单倍型的全基因组选择在大豆高世代育种群体中的有效性,为后续将目标功能基因的优良等位引入全基因组选择模型提供了依据。本研究取得的主要进展如下:(1)突变体快速定位的方法开发及应用本论文开发了一种称为M2-seq的BSA方法,只需要对M2世代突变体群体混合样本进行全基因组测序以及生物信息分析即可实现候选因果突变定位。相比已报道的方法,该方法主要进行了两点改良:1)不依赖野生型植株基因型作为参照的情况下,直接过滤获得诱变突变;2)换用delta SNP index的绝对值用于绘制定位曲线,从而消除了M2群体突变等位基因之间相位排斥对定位的干扰。在本论文涉及的10个独立的大豆M2群体中,M2-seq方法成功定位了所有携带因果突变的基因组区域。10个群体平均定位区间大小为7.7Mb,并且在其中9个群体中成功锁定了唯一的候选因果突变。我们选取其中两个突变体,通过突变体表型和基因功能分析,证明候选因果突变与突变体表型异常相关。这些结果证明了M2-seq对于突变体基因克隆的有效性。与已报道的方法相比,M2-seq至少将突变体基因定位所需的时间缩短了一个世代,提高了突变体功能突变挖掘的速度。(2)大豆基因权重共表达网络构建以及突变体因果基因的调控机制解析利用来源公共数据库的531份转录组数据,构建了涵盖大豆7大类器官基因表达特征的基因权重共表达网络。该网络由41个共表达模块构成,涵盖22,760个基因。通过M2-seq获得的9个候选因果突变基因均可以在共表达网络中定位到对应模块。本论文对其中两个因果突变基因进行了功能机制解析。分析发现突变体Mut01的因果突变基因Glyma.08G193200(Gm RHD3)可能受到TGA转录因子调控,并且Gm RHD3功能可能不仅仅局限于调节大豆表皮毛密度等表型形态,还可能通过调节Gm ERF5等转录因子表达,影响大豆生长、发育及胁迫应答等生物学过程。突变体Mut07的因果突变基因Glyma.10G251500(Gm THI1)作为一种硫胺素合成酶,在调控网络中处于中枢位置。分析还发现各类伴侣蛋白与Gm THI1可能共同参与了大豆抵御逆境胁迫的调控过程。以上研究结果表明,利用公共数据库来源的转录组数据构建的基因调控网络,可以有效预测突变体因果突变基因的调控机制,为进一步的分子实验提供线索。(3)证明基于单倍型的全基因组选择在大豆高世代育种群体中的有效性本论文未在自然群体中找到M2-seq定位得到的9个突变体候选因果突变,但对应突变基因在自然群体中存在丰富的变异以及单倍型。通过全基因组关联分析,发现9个突变基因与大豆含油量、蛋白含量两个目标性状没有显著关联。尽管如此,本论文依然论证了单倍型用于全基因组选择的可行性,为后续将其他突变功能基因的自然群体优良等位引入全基因组选择模型提供参考。在688株大豆构成的F4家系以及953株高世代品种构成的育种群体中,分别进行了基于单倍型和基于SNP的全基因组选择分析。结果表明:1)在大豆F4群体中单倍型多样性较低,基于SNP对含油量和蛋白含量的预测精度最高分别达到0.39和0.54,基于单倍型的预测精度并没有明显优势;2)在大豆育种群体中单倍型多样性较高,连续5个SNP构成的单倍型对含油量和蛋白含量的预测精度分别最高可以达到0.50和0.48,优于连续25个SNP构成的单倍型的预测精度(含油量:0.44,蛋白含量:0.42);3)在建模群体超过整个群体规模60%的前提下,连续5个SNP构成的单倍型的预测精度优于基于SNP的预测精度(含油量:0.50 vs 0.45;蛋白含量:0.48 vs 0.44)。因此,基于单倍型的全基因组选择在大豆高世代育种群体中将有更大的应用潜力。