论文部分内容阅读
数量遗传学是根据遗传学原理,运用适宜的遗传模型及数理统计的理论和方法,探讨生物群体内个体间数量性状变异的遗传基础,研究数量性状遗传传递规律及其在生物改良中应用的一门理论与应用学科。而现代数量遗传学是从分子水平上揭示数量变异的遗传基础和遗传规律的科学。运用数理统计方法对分子标记和表型测量的数据组合进行分析。又称分子数量遗传学。不论从QTL定位还是新的统计工具对原有资料的重新分析来看,控制数量性状的基因在效应上存在很大的差异,效应比较大的基因表现出主基因特性,效应比较小的表现为微效多基因特性,而遗传模式是介于主基因和多基因遗传模式之间的一种类型。Gai et al根据混合分布理论、极大似然估计、EM算法及IECM算法建立了植物数量性状遗传体系,用于研究主基因+多基因混合遗传模型。本研究是植物数量性状遗传体系基础上的拓展。首先,将ECM算法的条件极大化部分进行改进,让环境方差稳定且仅由同质群体确定,实施局部迭代,形成局部迭代的ECM算法,这种方法称为JECM算法。其次,将单个分离世代与不分离世代联合,运用一步法、EM算法及JECM算法,将原有的1~2对主基因+多基因混合遗传模型拓展到3对具有连锁(包括两个主基因间的连锁和三个主基因间两两连锁)的主基因+多基因混合遗传模型。所获得的主要结果是:1.遵从数量遗传学原理,将分离群体成分分布方差剖分为主基因方差组分、多基因方差组分和环境方差组分,运用Lagrange乘数法及JECM算法对混合分布中各成分分布参数进行估计。步骤为:①根据各群体统计数选择分布参数初值,包括:分布平均数初值μ(0)、环境方差初值σ2(0)和多基因方差初值σj02(0);②为获得期望完全资料的对数似然函数LC((?)),实施E步骤,获得后验概率ωjit;③CM1步骤:固定σj02(0)、σ2(0),得到分布平均数的极大似然函数值μ(1);CM2步骤:固定μ(1)、σj02(0),得到环境方差的极大似然函数值σ2(1);CM3步骤:固定μ(1)、σ2(1),得到多基因方差的极大似然函数值σj02(1),④将③获得的分布参数估计值作为初值,重复③中CM1步、CM3步,直到相邻两次间的极大对数似然函数值相差很小为止。2.在1~2对主基因+多基因混合遗传模型的的基础上,对于F2群体,建立了3对具有连锁(A、B、C中A、B连锁及A,B,C两两连锁)的12种主基因混合遗传模型,使遗传模型发展到七类34种,通过高粱恢复系591×560组合开花期数据的遗传分析证实,高粱开花期受3对连锁主基因(A、B、C中A,B连锁)控制,符合加性-显性-上位性模型,第一对、第二对主基因呈负向超显性,第三对主基因呈部分显性,主基因遗传率为66.99%。对于P1、F1、P2、B1+B2世代联合,建立了3对具有连锁(A、B、C中A、B连锁)的5种主基因+多基因混合遗传模型,使遗传模型发展到六类28种,通过油菜(宁油七号×农林41)组合BC1F1世代的开花期数据证实,油菜的开花期受3对连锁主基因(A,B连锁)控制,符合加性.显性模型,第一对主基因呈加性,第二对主基因呈完全显性,第三对主基因呈负向完全显性。B1群体的主基因遗传率为78.83%,B2群体的主基因遗传率为85.25%。对于P1、F1、P2、F2:3世代联合,建立了3对具有连锁(A、B、C中A、B连锁)的6种主基因+多基因混合遗传模型,使遗传模型发展到六类28种;对于P1、F1、P2、B1:2+B2:2世代联合,建立了3对具有连锁(A、B、C中A、B连锁)的5种主基因+多基因混合遗传模型,使遗传模型发展到六类26种。通过油菜HSTC14(P1)×宁油7号(P2)组合F2:3家系世代的芥酸试验数据证实,油菜HSTC14×宁油7号组合的芥酸含量符合3对主基因(A、B、C中A,B连锁)的加性-显性-上位性模型,第一对主基因呈负向完全显性,第二对主基因呈部分显性,第三对主基因呈负向超显性,主基因遗传率为56.55%。3.用构建的1~3对主基因遗传模型来配合个别分离群体,从中筛选出适合性最好的模型作为控制数量性状的主基因模型。由于家系平均数误差小于单株观测值误差、多个分离世代联合分离分析优于个别世代分离分析,利用同质群体(P1、P2和F1)的加入,来鉴定多基因的存在,从而确定数量性状的遗传模型。从例证来看,利用单个分离世代与不分离世代的联合分析,可提高主基因加性与显性效应的估计精度,揭示出更多的遗传信息。4.通过20次重复的Monte Carlo模拟试验验证出JECM算法与IECM算法筛选最适遗传模型的一致性。5.利用MATLAB语言编写了以上所有模型的计算程序。本研究改进并简化了分离分析中的参数估计方法,丰富了植物数量性状遗传体系中的遗传模型,从而进一步完善了植物数量性状遗传体系。