论文部分内容阅读
芒草为禾本科高粱族甘蔗亚族芒属植物,多年生高大C4禾草,与其近缘作物甘蔗和高粱相比,芒属植物的高生物量使其成为具有巨大发展潜力的生物质新能源作物。由于其复杂的基因组和自交不亲和的特性,高质量高密度遗传图谱的构建和QTL定位分析较为困难,低成本高通量的新一代测序技术(NGS)的发展,使其广泛的应用于遗传图谱的构建、基因定位克隆等方面的研究,成为品种改良和新品种培育的一种有效手段。RAD-seq测序技术是简化基因组研究的一种有效策略。NGS技术结合RAD策略对SNP标记的开发提供了有力的帮助。本研究以芒属中的五节芒和荻种间杂交的分离群体为试验材料,利用SNP和SSR分子标记分别构建了五节芒和荻的高质量高密度的遗传图谱,并进行部分表型性状的QTL初步分析。主要结论如下:
1.以芒属中的五节芒和荻种间杂交得到的分离群体中116个单株为试验材料,结合新一代测序和RAD-seq技术,以甲基化敏感的限制性内切酶AscI酶切基因组DNA构建了包括亲本的118个测序文库。通过Illumina Hiseq2500平台100bp的双末端测序,获得187G的有效数据。通过系统的生物信息学分析,匹配到高粱基因组上的测序数据得到7,335个多态性SNP位点。未匹配到高梁基因组的序列进行无参考基因组的序列拼接,在N50=374bp的最佳选择下获得6,556个拼接片段,这些拼接片段占芒草基因组的1%,为芒草基因组特有序列。以此为参考基因组进行SNP标记的挖掘发现了2,848个多态性SNP位点。对10,183个多态性位点进行卡方检测,以x2<60为阀值,只母本中多态性的SNP标记共获得2,840个,只父本多态性SNP标记2,518个,在双亲中多态性的SNP标记2,392个。
2.利用misa和Primer3软件对甘蔗和芒草的基因组、EST序列设计SSR标记,共获得2,496对SSR引物,在芒草已公布的基因组和EST序列中开发的SSR标记平均密度分别为10个SSR/Mb和32个SSR/Mb,EST序列中平均分布的SSR标记数量显著高于在基因组中平均分布的SSR标记数量。所有SSR标记中三核苷酸重复单元的标记数量最多,为1557(62.4%)个。
3.以设计的2,496个标记在两个亲本及随机选择的10个F1子代中进行多态性筛选,获得644个多态性SSR标记,扫描作图群体,获得1,279个多态性位点。多态性位点偏分离分析结果显示,分别有723和596个SSR位点用于五节芒和荻的遗传连锁图谱的构建。
4.利用5,596和5,506个分子标记连锁分析分别构建了五节芒和荻的高质量高密度遗传图谱,分别包含4,490(3910SNPs和580SSRs)和3,105(2,709SNPs和396SSRs)个标记,遗传距离总长分别为3,198.26和3,291.04cM,相邻标记的平均遗传距离为0.72和为1.06cM。
5.针对作图群体的分蘖、株高和开花期等三个表型性状进行重复调查统计分析。利用完备区间作图法进行QTL初步分析,结果显示以五节芒遗传图谱为基础,检测到与分蘖、株高及开花期相关的QTL位点分别是69、60及126个,可重复检测的稳定QTL位点分别有2、3和5个;以荻的遗传图谱为基础,检测到与分蘖、株高及开花期相关的QTL位点分别是63、97及71个,可重复检测的稳定QTL位点分别有4、3和3个。
RAD-seq技术成功的应用于芒属植物高质量高密度遗传连锁图谱的构建,结合表型数据进行了QTL初步定位分析。本研究为芒属植物的遗传学、重要基因克隆、基因组学研究等建立了一个重要科研平台,对进一步进行芒属植物的品种改良和新品种培育提供重要参考和借鉴,为今后开发芒草作为重要能源作物具有重要意义。
1.以芒属中的五节芒和荻种间杂交得到的分离群体中116个单株为试验材料,结合新一代测序和RAD-seq技术,以甲基化敏感的限制性内切酶AscI酶切基因组DNA构建了包括亲本的118个测序文库。通过Illumina Hiseq2500平台100bp的双末端测序,获得187G的有效数据。通过系统的生物信息学分析,匹配到高粱基因组上的测序数据得到7,335个多态性SNP位点。未匹配到高梁基因组的序列进行无参考基因组的序列拼接,在N50=374bp的最佳选择下获得6,556个拼接片段,这些拼接片段占芒草基因组的1%,为芒草基因组特有序列。以此为参考基因组进行SNP标记的挖掘发现了2,848个多态性SNP位点。对10,183个多态性位点进行卡方检测,以x2<60为阀值,只母本中多态性的SNP标记共获得2,840个,只父本多态性SNP标记2,518个,在双亲中多态性的SNP标记2,392个。
2.利用misa和Primer3软件对甘蔗和芒草的基因组、EST序列设计SSR标记,共获得2,496对SSR引物,在芒草已公布的基因组和EST序列中开发的SSR标记平均密度分别为10个SSR/Mb和32个SSR/Mb,EST序列中平均分布的SSR标记数量显著高于在基因组中平均分布的SSR标记数量。所有SSR标记中三核苷酸重复单元的标记数量最多,为1557(62.4%)个。
3.以设计的2,496个标记在两个亲本及随机选择的10个F1子代中进行多态性筛选,获得644个多态性SSR标记,扫描作图群体,获得1,279个多态性位点。多态性位点偏分离分析结果显示,分别有723和596个SSR位点用于五节芒和荻的遗传连锁图谱的构建。
4.利用5,596和5,506个分子标记连锁分析分别构建了五节芒和荻的高质量高密度遗传图谱,分别包含4,490(3910SNPs和580SSRs)和3,105(2,709SNPs和396SSRs)个标记,遗传距离总长分别为3,198.26和3,291.04cM,相邻标记的平均遗传距离为0.72和为1.06cM。
5.针对作图群体的分蘖、株高和开花期等三个表型性状进行重复调查统计分析。利用完备区间作图法进行QTL初步分析,结果显示以五节芒遗传图谱为基础,检测到与分蘖、株高及开花期相关的QTL位点分别是69、60及126个,可重复检测的稳定QTL位点分别有2、3和5个;以荻的遗传图谱为基础,检测到与分蘖、株高及开花期相关的QTL位点分别是63、97及71个,可重复检测的稳定QTL位点分别有4、3和3个。
RAD-seq技术成功的应用于芒属植物高质量高密度遗传连锁图谱的构建,结合表型数据进行了QTL初步定位分析。本研究为芒属植物的遗传学、重要基因克隆、基因组学研究等建立了一个重要科研平台,对进一步进行芒属植物的品种改良和新品种培育提供重要参考和借鉴,为今后开发芒草作为重要能源作物具有重要意义。