论文部分内容阅读
大豆(Glycine max)起源于我国,含有丰富的蛋白质、不饱和脂肪酸、微量元素和维生素等多种营养物质,是我国重要的粮、油、饲兼用作物,在国民经济发展和保障国家粮食安全中具有重要的战略地位。栽培大豆由其祖先野生大豆(G.soja)被长期定向选择和改良驯化而成,但长期的人为选择育种导致大豆的遗传资源丢失和基因库匮乏,限制大豆产量和品质的进一步提高。大豆属包含一年生的Soja亚属和多年生的Glycine亚属,其中Glycine亚属作为Soja亚属的野生近缘种,具有荚粒数多、抗虫害和病害、耐干旱和盐胁迫等许多优异的产量性状和抗性性状,对于改良一年生栽培大豆、培育优异大豆新品种具有潜在的利用价值。本研究对Glycine亚属具有代表性的5个多年生二倍体和1个多年生异源四倍体大豆进行基因组测序和组装,结合Soja亚属一年生大豆基因组数据构建了大豆属水平泛基因组,并进行大豆属内多倍体进化规律的研究,主要研究结果如下:1、本研究利用Illunima测序、PacBio单分子实时测序、染色质构象捕获Hi-C技术等测序技术对大豆属5个多年生二倍体A、B、C、D、F基因组和1个多年生异源四倍体AtDt基因组进行测序和组装,并通过整合前期从同一套材料中生成的细菌人工染色体数据进一步矫正,最终获得了6个多年生大豆染色体级别的高质量参考基因组;以及利用多年生大豆植株根、叶、花组织混合样品的转录组数据进行各自基因组蛋白编码基因的注释。最终,组装完成的大豆属6个多年生大豆基因组大小和注释的蛋白编码基因数目分别为:A基因组(948.2Mb,55,376)、B基因组(941.1Mb,55,844)、C基因组(1,286.6Mb,56,496)、D基因组(999.9Mb,56,862)、F基因组(1,393.4Mb,58,312)、AtDt基因组(1,952Mb,113,697)。2、利用蒺藜苜蓿、菜豆、一年生大豆和本研究组装的多年生大豆基因组的单拷贝直系同源基因构建一年生与多年生大豆系统进化树,发现一年生与多年生大豆约在7百多万年前发生分化,通过比较一年生和多年生大豆基因组间大于50kb大小的染色体重组事件,鉴定到183个染色体大片段重组事件,且多年生大豆基因组染色体重排少于一年生大豆基因组,表现出更大的基因组稳定性。此外,比较两个亚属间基因组,发现长末端重复序列反转录转座子是所有转座子类型中最丰富的一种,在大豆不同种间表现出不同的扩增且在基因组进化中以惊人的速度和程度发生丢失;分析两个亚属间着丝粒区域,发现一年生大豆基因组中的着丝粒卫星重复序列在多年生大豆基因组中很少检测到同源拷贝,并通过分析多年生大豆基因组中丰富的串联重复序列及其染色体分布发现在B、C、A、D基因组中即不存在与一年生大豆类似也不存在其自身特异的着丝粒卫星重复序列。3、利用本研究组装的多年生大豆二倍体基因组和前人发表的一年生大豆基因组数据,构建了一个大豆属水平的泛基因组,发现多年生大豆基因组中70%的基因位点在一年生大豆基因组中发生丢失;比较分析一年生和多年生大豆的核心基因和非核心基因以及计算突变位点的非同义突变率(Ka)、同义突变率(Ks)以及Ka/Ks比值,发现两个亚属间的核心基因较非核心基因受到更强的纯化选择,但是亚属内不存在明显差异,这些结果表明了一年生和多年生大豆发生分化后各自独立的基因组进化过程。4、分析多年生异源多倍体亚基因组与其两个祖先基因组的染色体共线性,发现异源多倍体的形成会导致优势亚基因组(At)的产生,以及异源多倍体形成时基因的丢失存在偏好性,即非核心基因比核心基因具有更高的丢失趋势、单基因比多基因具有更高的丢失趋势、基因缺失倾向于以Cluster的形式发生、亚基因组中基因丢失率与祖先基因组同源基因表达水平呈负相关、亚基因组中保留两个同源基因的基因位点受到更强的纯化选择。5、利用本研究组装的5个多年生大豆二倍体基因组数据和前人发表的7个一年生野生大豆基因组数据进行全基因组同源基因筛选,鉴定出52个可能与两个亚属间的适应性进化和亚属内纯化选择相关的注释基因,对该52个基因进行GO富集分析发现有6个基因参与细胞分化和花发育生物过程,通过计算Ka/Ks比值发现其中的两个基因在一年生和多年生大豆间存在强纯化选择和适应性进化。鉴于该2个基因在拟南芥中同源基因(PHP和D14)的功能——影响拟南芥从营养生长到生殖生长的转变,我们推测其可能在一年生和多年生大豆生活习性的转变和适应性进化中发挥重要作用。