论文部分内容阅读
六棱裸大麦(即青稞)是生活在青藏高原地区的藏族人民的主要口粮,同时也是重要的饲料作物和酿造原料作物。长期以来青稞育种主要以提高产量为目标,对青稞籽粒蛋白质含量(Grain Protein Content, GPC)为主的品质性状关注较少。同时,青藏高原又蕴藏着丰富的野生大麦和青稞地方品种等具有优异品质性状的种质资源,对其籽粒蛋白质含量及其形成的基因组学基础研究匮乏。本研究以302份青藏高原野生大麦、青稞地方品种和育成品种及少数外引大麦栽培品种为研究群体,在获取了参试材料2013年和2014年两个年度的籽粒蛋白质含量(GPC)表型鉴定(Phenotyping)数据的同时,用2304个DArT(DiversityArray Technology, DArT)标记进行了参试群体的全基因组扫描(Genome-wide Scanning)并获得了基因分型(Genotyping)数据。在进行参试材料群体GPC表型变异分析、群体结构和基因组连锁不平衡性估测的基础上,开展了GPC性状/DArT标记间的全基因组关联分析(Genome-wide Association Analysis,GWAS)和基于HvNAM1和HvNAM2的候选基因关联分析(Candidate-gene association analysis,CGAS)研究。期望得到控制GPC的优异等位变异(单倍型)和分子标记,定义相关基因组区段,为今后开展青稞品质分子育种提供可用的育种元件。本研究主要得到如下结论: 1.参试材料群体籽粒蛋白质含量存在丰富的表型变异。302份参试材料两年度GPC平均值为13.56%,变异范围为8.23%-22.67%。不同类型材料间GPC存在显著差异,野生大麦GPC最高为14.49%,青稞地方品种居中(GPC=12.68%),青稞育成品种GPC最低为10.32%。在青稞驯化和育种过程中,随着产量的提高,GPC有逐步降低的趋势。筛选到一批籽粒蛋白质含量极高(如野生大麦ZYM2749,其GPC均值为22.67%)和极低(如北青8号,其GPC均值为8.23%)等不同含量水平的青稞种质资源,可以在今后的育种过程中加以利用。 2.参试材料群体内存在较为丰富的遗传变异。在基因组水平上,所有参试材料1396个多态性DArT标记的多态性信息含量(Polymorphism information content, PIC)变异范围为0.0073-0.5000,平均值为0.2715。不同染色体间DArT标记多态性存在差异,1H和6H具有较高的多态性,2H、5H和7H的多态性居中,3H多态性较低,4H上可用的标记数较少且多态性最低(PIC=0.2225)。 3.经贝叶斯、主坐标分析和聚类分析三种方法检测,参试材料群体内存在明显的群体分层,而且三种方法得到的结果高度一致、互相印证。最后确定参试群体可以划分为3个群体:POP1主要是青藏高原野生大麦,POP2主要是青稞地方品种和育成品种,POP3包括大部分青藏高原区域外外引大麦品种和部分青藏高原大麦材料。对参试材料群体基因组连锁不平衡(Linkage disequilibrium,LD)水平的估测结果表明,参试群体在基因组水平和不同染色体内均存在一定程度的连锁不平衡性,而且这种连锁不平衡主要来自于染色体内部而非不同染色体间。参试群体DArT成对位点r2值随着遗传距离的增加迅速衰减且遵循方程:y=aln(x)+b。当r2=0.2时,整个基因组的LD衰减距离为6.34cM。 4.综合一般线性模型(General Linear Model,GLM)和混合线性模型(Mixed LinearModel,MLM)的DArT标记/GPC性状回归分析结果,在除4H以外的其余6条染色体上共检测到44个标记、35个位点同籽粒蛋白质含量显著关联。1H、2H、3H、6H和7H上分布了大部分检测到的标记(位点)。本研究所检测到的7个标记(5个位点)在以往的研究中已有报道,22个标记(18个位点)同已有报道的标记位置相近(<10cM),有15个标记(12个位点)为本研究新发现的的标记(或位点)。青稞基因组内同GPC相关的标记大部分呈簇状分布,在6条染色体上共有19个染色体区段集中分布了发掘到的39个标记,是GPC相关基因分布的热点区域。另有5个标记呈单个位点散布于5条染色体上。 5.参试群体在HvNAM1基因内共检测到6个SNP位点,分别位于+54bp、+234bp、+544bp、+563bp、+1004bp和+1433bp处,全部位于3个外显子区且为错义突变(MissenseMutation)。6个SNP变异形成8种单倍型,其中Hap4出现频率最高(46.69%),其次是Hap3、Hap7和Hap5。Hap1、Hap2、Hap6和Hap8为稀有单倍型(出现频率F<0.01)。野生大麦携带有7种单倍型,青稞地方品种和育成品种各携带有5种单倍型,而外引大麦品种只携带有2种单倍型。携带不同单倍型材料的籽粒蛋白质含量存在差异。单倍型进化关系结果表明,Hap4是最为原始的单倍型,Hap2、Hap5、Hap6、Hap7和Hap8有着同Hap4最为接近的亲缘关系。Hap1是由Hap4经两次单碱基替换形成的,与Hap4亲缘关系较远。Hap2和Hap5发生等位基因交换进而形成了单倍型Hap3。Hap1和Hap3是在距今最近的年代形成的;HvNAM2基因上共检测到9个SNPs和1个InDel位点,分布在HvNAM2基因5UTR区、第一内含子区、第二和第三外显子内,有4个错义突变和2个同义突变(Synonymous Mutation),共形成了10种单倍型。Hap3出现频率最高(82.45%),其后依次是Hap10和Hap9,其余均为稀有单倍型(F<0.01)。野生大麦携带有7种单倍型,青稞地方品种携带有6种单倍型,育成品种携带有4种单倍型,而外引大麦品种携带有4种单倍型。携带不同单倍型材料的蛋白质含量存在差异。单倍型进化关系结果表明,Hap3是最为原始的单倍型类型。Hap1、Hap2、Hap5和Hap8是由Hap3发生单碱基突变形成的,有着同Hap3最为接近的亲缘关系。Hap4是由Hap3在1474位置发生6碱基的缺失形成。Hap6是由Hap3经过了4次单碱基突变形成,Hap8、Hap7和Hap9是其中间过渡类型。Hap7经过连续两次单碱基突变形成Hap10。在青稞驯化和育种过程中,存在一条Hap3-Hap8-Hap7-Hap10的进化支路。 6.采用一般线性模型和混合线性模型两种方法,对HvNAM1和HvNAM2基因的16个SNP位点、18个单倍型与参试群体籽粒蛋白质含量(GPC)进行关联分析。两种模型在HvNAM1基因内均检测到有2个SNP位点同GPC显著关联,分别是Exon1中+234bp处的G/C替换和Exon3中+1433bp处的G/A替换。Exon1中+234bp处G/C替换引起编码氨基酸的色氨酸/半胱氨酸(Trp/Cys)的错义突变,两种模型下的变异解析率分别是8.84%(GLM)和1.39%(MLM)。Exon3中+1433bp处的G/A替换引起编码氨基酸的丙氨酸/苏氨酸(Ala/Thr)错义突变,两种模型下的变异解析率分别是1.58%(GLM)和4.01%(MLM)。HvNAM1基因单倍型Hap3同蛋白质含量间在两种模型下均存在显著关联,其变异解析率分别是9.11%(GLM)和1.30%(MLM),在一般线性模型下,Hap4同GPC间存在显著关联,其变异解析率7.62%。在两种模型下,HvNAM2基因内未发现与籽粒蛋白质含量显著关联的位点或单倍型。