论文部分内容阅读
水稻中的蛋白质是水稻中最为重要的营养品质之一,其含量仅次于稻米中的淀粉含量,居于第二位。伴随着人们生活水平的逐渐提高,食疗保健也成为了人们所选择的一种生活方式,食用蛋白质含量过高的稻米会加重糖尿病患者和肾脏病人的负担,而健康人群却可以食用蛋白质含量高的稻米以增加蛋白质的摄入。因此,研究控制水稻蛋白质含量的分子机制,发掘调控水稻蛋白质含量的相关分子位点及相关载体材料,随后通过育种手段来对水稻中的蛋白质含量进行改良,为培育满足不同人群不同品质需求的水稻品种,成为了水稻育种上一个具有深远意义的目标。前人对于水稻中蛋白质的研究主要集中于使用连锁分析的研究方法进行糙米或精米蛋白质的QTL定位,鲜有研究致力于水稻中的各种不同蛋白成分。关联分析是用于解析复杂数量性状遗传基础的一种主要方法,分为全基因组关联分析(Genome-wide Association Study,GWAS)和候选基因关联分析(Candidate-gene Association Analysis)。因此,本研究采用具有广泛地理来源的329份水稻试验材料构建而成的自然群体,以及均匀分布于水稻全基因组的154对SSR(Simple Sequence Repeat)引物,采用全基因组关联分析的研究方法,对水稻籽粒中的清蛋白、球蛋白、醇溶蛋白和谷蛋白四种蛋白成分进行分析,进一步发掘与各种蛋白表型显著相关的优异等位变异及载体材料,对于改良水稻蛋白质含量及各成分比例具有重要意义。利用从基础试验群体中选择的128份更具代表性试验材料构建而成的自然群体及测序得到的谷蛋白候选基因GluA和GluB1的基因序列,采用候选基因关联分析的研究方法,发掘与水稻谷蛋白含量显著关联的SNP、InDel位点及相关优势单倍型,为采用分子育种手段改良水稻谷蛋白含量提供理论参考。主要研究结果如下:(1)采用考马斯亮蓝G-250法对自然群体中包含的329份水稻材料进行两年四种蛋白成分的检测,试验群体中存在明显的变异且变异范围较大,各种性状在试验群体中均符合正态分布,表现出了较为典型的数量性状遗传特征。(2)利用154对均匀分布于水稻12条染色体的SSR标记,对试验自然群体分别进行了遗传多样性分析、亲缘关系分析、群体结构分析和连锁不平衡分析。在329份试验材料中一共扩增出了845个等位变异,等位变异的平均值为5.49,等位变异的范围在2到9之间;亲缘关系分析显示,亲缘关系系数为0的比例为58.6%,系数在0到0.1之间的比例为90.6%,说明试验群体中材料之间的亲缘关系较远;连锁不平衡分析表明,41.35%的位点组合呈现出了显著的连锁不平衡(P<0.01),各个亚群中的连锁不平衡水平高于整个自然群体的连锁不平衡水平;群体结构分析结果显示,整个群体可以被分为3个亚群,存在1个MIX亚群,3个亚群中的品种数量分别为29、81和147。(3)利用154对SSR标记通过TASSEL软件中的一般线性模型(General Linear Model,GLM)和混合线性模型(Mixed Linear Model,MLM)分别对稻米籽粒中的四种蛋白成分进行全基因组关联分析。结果显示在两年的研究中,一共有15个位点在GLM和MLM两种模型下均能够检测到。与清蛋白、球蛋白、谷蛋白和醇溶蛋白显著关联的位点数分别为5个、5个、2个和3个。(4)得到了四种蛋白组分的优异等位变异。其中,与清蛋白、球蛋白、醇溶蛋白相关的优异等位变异分别为RM233、RM253和RM1284,与高谷蛋白含量相关的优异等位变异为RM415,与低谷蛋白含量相关的优异等位变异为RM241。(5)对水稻谷蛋白合成基因GluA和GluB1分别进行了深度测序。在GluA中,基因范围内一共检测到了128个多态性位点,排除频率低于5%的多态性位点,在编码区和非编码区一共检测到46个SNP位点和8个InDel位点;在GluB1中,整个基因范围内一共检测到了269个多态性位点,排除频率低于5%的多态性位点,在编码区和非编码区一共检测到了10个SNP突变及InDel突变,其中6个是SNP突变,4个是InDel突变。(6)利用TASSEL5.0软件分别对两个候选基因进行中性选择分析和连锁不平衡分析。在基因GluA范围内,除了第一个外显子,第二个外显子和第一个内含子之外,均显著偏离中性进化模型;在基因GluB1范围内,除了第二个内含子,基因范围内的其他区域均显著地偏离中性进化模型。对于两个候选基因的连锁不平衡分析,在基因GluA范围内,几乎所有的多态性位点均处于连锁不平衡的状态(包含出现频率高于5%的多态性位点),且连锁不平衡情况均为显著;而在基因GluB1范围内,在检测到的10个SNP及InDel位点中,并不存在显著的连锁不平衡情况。(7)利用154对SSR标记对128份材料构建而成的试验群体进行群体结构分析,结果显示试验材料可以被划分为3个亚群。3个亚群中的材料数量分别为35、11和57,同时存在一个MIX亚群,各亚群中材料的划分情况与之前群体的划分的情况基本一致。(8)对两个候选基因分别进行了单倍型分析。在基因GluA中,频率高于5%的多态性位点将整个群体划分成了37个单倍型,单倍型多态性(Haplotype diversity,Hd)为0.461。材料在基因GluA的所有单倍型中展现出了不平衡分布,其中单倍型GluAHap-1(基因GluA的第1个单倍型)包含了73份试验材料;在基因GluB1中,可以通过检测到的多态性位点划分出21个单倍型,单倍型多态性为0.341,同样呈现出不平衡的分布,其中单倍型GluB1Hap-1(基因GluB1的第1个单倍型)包含了84份试验材料,两个基因的单倍型多态性都相对较低。(9)对两个基因分别进行了蛋白型分析。在基因GluA中,大部分SNP位点位于该基因的第1个外显子区域内,最终43个SNP位点将整个群体分成了27个蛋白单倍型;在基因GluB1中,只有1个SNP位点位于外显子区域内,所以蛋白单倍型被划分为两种。两个基因中的蛋白单倍型均呈现出不平衡的分布,其中CDS_GluAHap-1(基因GluA的第1个蛋白单倍型)包含了89份试验材料,CDS_GluB1Hap-1(基因GluB1的第1个蛋白单倍型)包含了121份试验材料。(10)利用TASSEL5.0软件中的GLM模型和MLM模型进行候选基因关联分析。在GluA中,两种模型下检测到了5个与水稻籽粒谷蛋白含量显著关联的多态性位点,均为SNP,分别位于GluA序列的10 bp、22 bp、55 bp、78 bp和87 bp处;在GluB1中,两种模型下检测到了2个与水稻籽粒谷蛋白含量显著关联的多态性位点,其中1个为SNP,另1个为InDel,分别位于GluB1序列的1426 bp处和1489 bp处。在GluA中,发现了两种低谷蛋白含量的单倍型,分别是GluAHap-10和GluAHap-34;在GluB1中,同样发现了两种低谷蛋白含量的单倍型,分别是GluB1Hap-5和GluB1Hap-12。(11)利用高分辨率溶解曲线技术(High-resolution melting curve,HRM)对检测到的SNP和InDel位点进行验证,结果表明溶解曲线的图像与检测到的序列多态性位点保持一致,验证了研究结果的准确性。