论文部分内容阅读
摘 要:数量性状基因的定位又叫QTL定位,QTL 定位就是采用类似单基因定位的方法将QTL 定位在遗传图谱上,确定QTL 与遗传标记间的距离。QTL定位的基本原则是关联度量的遗传变异和表型变异。群体的选择、用于度量表型个体选择和基因型判型个体的选择是所有QTL定位设计要重点考虑的因素。本文介绍了小麦等作物不同作图群体的优缺点以及QTL定位的原理和方法,从而对遗传群体的选择以及QTL定位技术的使用提供依据。
1、QTL 作图群体的选择
QTL是quantitative trait locus的缩写,中文可以翻译成数量性状座位或者数量性状基因座,它指的是控制数量性状的基因在基因组中的位置。QTL 定位的第一步是选择合适的亲本构建作图群体。亲本选择要本着性状差异大和亲缘关系远的原则,以便发生较多的重组事件和表型变异,利于定位研究的进行。目前,小麦 QTL 定位常用的作图群体按照保存时间的长短,分为两类:临时性分离群体和永久性分离作图群体。前者包括 F2及其衍生的 F3、F4家系,以及回交产生的BC 群体等。后者包括 DH、RIL、IF2和 NIL 群体等。不同的群体具有各自的特性。临时性群体的主要特点是群体内各个体间基因型不同,杂合基因型占很大比例。它们包含的遗传信息丰富,可以同时估算加性、显性效应。缺点是个体间基因型存在杂合型,后代发生分离,群体结构发生改变,不能进行多年、多点试验。而永久性群体系内基因型一致,系间基因型不同,因此可以进行多重复、多年、多点试验,增加QTL 定位准确性。缺点是永久性群体由于系间基因型一致,不能估算显性效应;若群体量不够大,则提供的遗传信息不如临时性群体丰富。尤其是 DH 群体,染色体加倍时可能存在基因型的丢失,通常不适于构建分子标记连锁图。对于异花授粉作物,由于存在自交衰退现象,构建 RIL 意义不大。IF2区别于其他永久性群体的最大特点是可同时估算加性、显性及与显性相关的上位性效应。NILs 仅在系间存在染色体区段差异,消除背景干扰,因此可用于 QTL 的精细定位。另外,还存在另一种特殊的群体——自然群体。由于林木等植物具有很长的世代间隔,很高的遗传杂合性和遗传负荷,不能构建理想的群体类型;人工杂交困难,难以获得理想的群体量,使得遗传参数准确性不高。利用自然群体对这类植物进行 QTL 定位是实用、有效的。目前玉米、水稻、小麦等作物的自然群体用于植物数量性状的关联分析,大大提高了控制目标性状的基因或相关 QTL 的挖掘效率。
2、QTL 定位的原理和方法
QTL 定位是利用分子标记进行遗传连锁分析以检测出控制某一性状的所有基因的集合。其基本思想就是寻找数量性状与 DNA 分子标记的特定染色体片段之间的关系,也即通过分析整个染色體组的 DNA 分子标记和数量性状表型值的关系,将 QTL 逐一定位到连锁群的相应位置,并估计其遗传效应。
目前常用的 QTL 定位方法主要有以下五种:
(1)单标记分析法(SMA):通过方差分析、回归分析或似然比检验,比较不同标记基因型个体均值,如果差异显著,则说明控制该性状的 QTL 与标记连锁。此法不需要完整的分子标记连锁图谱,早期使用较多。缺点是不能确定该标记同几个 QTL 连锁,无法估计 QTL 位置、低估 QTL效应、容易产生假阳性、检测效率低等。
(2)区间作图法(IM):1989 年 Lander 和Botstein 等提出基于两侧标记的区间作图法。该方法能从置信区间推测 QTL 位置,可以实现对不存在互作的 QTL 的位置和效应值达到无偏估计,此外,QTL 检测所需群体小。缺点是回归效应为固定效应,无法估算基因型与环境间的互作及上位性,易产生假阳性 QTL,每次检测仅用两个标记,检测效率底。
(3)复合区间作图法(CIM):1994 年 Zeng提出结合区间作图和多元回归特点的 CIM 作图方法。该法仍采用最大似然法估测 QTL 位置和效应,从而保留了 IM 作图法的优点;假如不存在 QTL 间上位性及与环境间的互作,可以对 QTL 位置和效应做到无偏估计;同时结合全基因组标记信息,控制了背景遗传效应,提高了作图的精度。缺点是将两侧标记用作区间作图,会引起邻近标记区间 QTL 估计的偏离;不能分析基因型与环境的互作及上位性等遗传效应;运算速度慢等。
(4)完备区间作图法(ICIM):2007 年 Li 等提出完备区间作图法,弥补了 CIM 法算法上的一些缺陷,操作简单、参数估计稳定;可进行
QTL 间上位性检测,提高了 QTL 检测的准确性,假阳性 QTL 减少。
(5)基于混合线性模型的复合区间作图法(MCIM):1999 年朱军提出用随机效应的预测方法或的基因型效应及基因型与环境的互作效应,然后再用 IM 或 CIM 法进行遗传效应的分析。此法将效应估计和定位分析相结合,即可无偏分析 QTL 与环境的互作效应,又提高了作图的效率和准确性。
3、QTL定位的统计软件与阈值
随着许多物种高密度遗传连锁图谱的建立和分子标记技术的迅速发展,使得 QTL定位研究不断深入。目前 QTL 定位常用的统计分析软件有 Microsoft Excel、SAS、SPSS,QTL 作图软件主要有 Mapmaker/QTL、Map Manager QTL、QTL Cartographer(http://statgen.ncsu.edu/qtlcart)、Ici Mapping(http://www.isbreeding.net)和 Join Map等。QTL 定位所设阈值(LOD 值)多为 2.0~3.0(P=0.01 或 P=0.001 或 P=0.005)。一般认为,LOD 值过高则容易漏掉效应较小的 QTL;LOD 值过低则容易产生“假阳性”QTL,即不是 QTL 的位点也被认为是 QTL。另外,LOD 值还与群体大小有关,小群体用大的阈值会大大减少 QTL 的检出个数。因此,有必要运用较小的阈值进行检测,以发现所有的 QTL 位点。总之,QTL 定位结果受到群体大小、阈值、标记间遗传距离及统计方法等诸多因素的影响,一些遗传率较低、贡献率较小的 QTL 检测结果是不可靠的,有待进一步验证。
1、QTL 作图群体的选择
QTL是quantitative trait locus的缩写,中文可以翻译成数量性状座位或者数量性状基因座,它指的是控制数量性状的基因在基因组中的位置。QTL 定位的第一步是选择合适的亲本构建作图群体。亲本选择要本着性状差异大和亲缘关系远的原则,以便发生较多的重组事件和表型变异,利于定位研究的进行。目前,小麦 QTL 定位常用的作图群体按照保存时间的长短,分为两类:临时性分离群体和永久性分离作图群体。前者包括 F2及其衍生的 F3、F4家系,以及回交产生的BC 群体等。后者包括 DH、RIL、IF2和 NIL 群体等。不同的群体具有各自的特性。临时性群体的主要特点是群体内各个体间基因型不同,杂合基因型占很大比例。它们包含的遗传信息丰富,可以同时估算加性、显性效应。缺点是个体间基因型存在杂合型,后代发生分离,群体结构发生改变,不能进行多年、多点试验。而永久性群体系内基因型一致,系间基因型不同,因此可以进行多重复、多年、多点试验,增加QTL 定位准确性。缺点是永久性群体由于系间基因型一致,不能估算显性效应;若群体量不够大,则提供的遗传信息不如临时性群体丰富。尤其是 DH 群体,染色体加倍时可能存在基因型的丢失,通常不适于构建分子标记连锁图。对于异花授粉作物,由于存在自交衰退现象,构建 RIL 意义不大。IF2区别于其他永久性群体的最大特点是可同时估算加性、显性及与显性相关的上位性效应。NILs 仅在系间存在染色体区段差异,消除背景干扰,因此可用于 QTL 的精细定位。另外,还存在另一种特殊的群体——自然群体。由于林木等植物具有很长的世代间隔,很高的遗传杂合性和遗传负荷,不能构建理想的群体类型;人工杂交困难,难以获得理想的群体量,使得遗传参数准确性不高。利用自然群体对这类植物进行 QTL 定位是实用、有效的。目前玉米、水稻、小麦等作物的自然群体用于植物数量性状的关联分析,大大提高了控制目标性状的基因或相关 QTL 的挖掘效率。
2、QTL 定位的原理和方法
QTL 定位是利用分子标记进行遗传连锁分析以检测出控制某一性状的所有基因的集合。其基本思想就是寻找数量性状与 DNA 分子标记的特定染色体片段之间的关系,也即通过分析整个染色體组的 DNA 分子标记和数量性状表型值的关系,将 QTL 逐一定位到连锁群的相应位置,并估计其遗传效应。
目前常用的 QTL 定位方法主要有以下五种:
(1)单标记分析法(SMA):通过方差分析、回归分析或似然比检验,比较不同标记基因型个体均值,如果差异显著,则说明控制该性状的 QTL 与标记连锁。此法不需要完整的分子标记连锁图谱,早期使用较多。缺点是不能确定该标记同几个 QTL 连锁,无法估计 QTL 位置、低估 QTL效应、容易产生假阳性、检测效率低等。
(2)区间作图法(IM):1989 年 Lander 和Botstein 等提出基于两侧标记的区间作图法。该方法能从置信区间推测 QTL 位置,可以实现对不存在互作的 QTL 的位置和效应值达到无偏估计,此外,QTL 检测所需群体小。缺点是回归效应为固定效应,无法估算基因型与环境间的互作及上位性,易产生假阳性 QTL,每次检测仅用两个标记,检测效率底。
(3)复合区间作图法(CIM):1994 年 Zeng提出结合区间作图和多元回归特点的 CIM 作图方法。该法仍采用最大似然法估测 QTL 位置和效应,从而保留了 IM 作图法的优点;假如不存在 QTL 间上位性及与环境间的互作,可以对 QTL 位置和效应做到无偏估计;同时结合全基因组标记信息,控制了背景遗传效应,提高了作图的精度。缺点是将两侧标记用作区间作图,会引起邻近标记区间 QTL 估计的偏离;不能分析基因型与环境的互作及上位性等遗传效应;运算速度慢等。
(4)完备区间作图法(ICIM):2007 年 Li 等提出完备区间作图法,弥补了 CIM 法算法上的一些缺陷,操作简单、参数估计稳定;可进行
QTL 间上位性检测,提高了 QTL 检测的准确性,假阳性 QTL 减少。
(5)基于混合线性模型的复合区间作图法(MCIM):1999 年朱军提出用随机效应的预测方法或的基因型效应及基因型与环境的互作效应,然后再用 IM 或 CIM 法进行遗传效应的分析。此法将效应估计和定位分析相结合,即可无偏分析 QTL 与环境的互作效应,又提高了作图的效率和准确性。
3、QTL定位的统计软件与阈值
随着许多物种高密度遗传连锁图谱的建立和分子标记技术的迅速发展,使得 QTL定位研究不断深入。目前 QTL 定位常用的统计分析软件有 Microsoft Excel、SAS、SPSS,QTL 作图软件主要有 Mapmaker/QTL、Map Manager QTL、QTL Cartographer(http://statgen.ncsu.edu/qtlcart)、Ici Mapping(http://www.isbreeding.net)和 Join Map等。QTL 定位所设阈值(LOD 值)多为 2.0~3.0(P=0.01 或 P=0.001 或 P=0.005)。一般认为,LOD 值过高则容易漏掉效应较小的 QTL;LOD 值过低则容易产生“假阳性”QTL,即不是 QTL 的位点也被认为是 QTL。另外,LOD 值还与群体大小有关,小群体用大的阈值会大大减少 QTL 的检出个数。因此,有必要运用较小的阈值进行检测,以发现所有的 QTL 位点。总之,QTL 定位结果受到群体大小、阈值、标记间遗传距离及统计方法等诸多因素的影响,一些遗传率较低、贡献率较小的 QTL 检测结果是不可靠的,有待进一步验证。