论文部分内容阅读
棉花是世界上最重要的经济作物之一,提供了最大量的天然纺织纤维。在四个主要的栽培棉种中,陆地棉由于其产量高和纤维品质较为优良,目前是世界范围内种植面积最大的棉花栽培种。陆地棉是异源四倍体,基因组结构比较复杂,导致通过常规育种方法同时提高产量和改良纤维品质十分困难。随着分子标记技术和高通量测序技术的广泛应用,为棉花高产、稳产、优质的新品种的培育起到巨大的推动作用。本研究利用分子标记和高通量测序技术,主要开展以下两个方面的工作,为陆地棉基因组的研究以及品种的改良提供研究基础:(1)利用RAD-seq技术基于双亲本开发分子标记用于陆地棉F2群体遗传图谱的加密;(2)陆地棉重组自交系群体遗传图谱的构建及产量和纤维品质相关性状的QTL定位。1.利用RAD-seq技术基于双亲本开发分子标记用于陆地棉F2群体遗传图谱的加密通过RAD-seq技术对两个陆地棉品种DH962和冀棉5号进行测序,DH962得到了62.46百万条原始reads,经过对测序结果原始序列进行过滤,得到大概5.15Gb的clean reads;冀棉5号得到61.27百万条原始reads,经过对测序结果原始序列进行过滤,得到大概5.18Gb的clean reads,两个品种GC含量分别为34.00%和34.17%。利用Velvet对两个品种的序列进行拼接,DH962得到178157条contigs,总碱基数为55.27Mb,平均长度为310.2bp。冀棉5号得到181422条contigs,总碱基数为57.06Mb,平均长度为314.5bp。通过对两亲本间的序列对比分析,分别设计得到了1323对SSR引物、3838对In Del引物和9366对SNP引物。SSRs、In Dels和SNPs的频率是1/10.58kb、1/18.46kb、1/6.55kb,SNP中转换和颠换的比例为1.76。将14433条包含引物的contigs和亚洲棉(A2)、雷蒙德氏棉(D5)的基因组序列进行BLAST比对,发现6995条contigs能够均匀地锚定到A2基因组的13条染色体上,7108条contigs能够均匀地锚定到D5基因组的13条染色体上。同时经过验证,SSR引物在海陆种间群体中使用效率更高,而In Dels和SNPs在陆地棉种内群体中使用效果更好。研究结果说明RAD-seq技术是一种经济有效的用于棉花分子标记开发的方法。然后以陆地棉DH962和冀棉5号为亲本,构建了一个包含137个单株的陆地棉F2群体。从本实验已经构建的一张高密度海陆种间BC1遗传图谱上挑选1869对引物,用于两亲本的筛选,其中187对引物在亲本间有多态性,得到192个多态性位点。同时从RAD-seq技术得到的引物中,得到了165个多态性位点。汇总本实验室林忠旭老师和付远志师姐以前得到的684个多态性位点,经过连锁分析构建了一张包含1013个位点,长3004.71c M,标记间平均距离为2.97c M的陆地棉种内遗传图谱。利用这张密度增加的遗传图谱对该群体的性状重新定位,发现随着图谱密度的增加,QTL检测的效率得到极大地提高。将陆地棉遗传图谱上面的562个(SRAP标记没有利用)能查找到序列的引物和亚洲棉(A2)、雷蒙德氏棉(D5)的基因组序列进行共线性分析。结果显示除了Chr2和Ga2,Chr5和Ga10,Chr10和Ga9之间,AT和A2基因组大部分相对应的染色体之间具有很好的共线性。Ga2和Ga10之间发生相互交换,同时一些Ga13的片段导入到了Gh10中,Ga1和Ga5的一些片段导入到了Gh2中。而DT和D5基因组的序列分析发现两者对应的染色体之间都具有很好的共线性,基本上没有出现染色体间的交叉。同时在其他同源性较好的对应染色体之间,有4条没有锚定到A2基因组染色体上的scaffolds匹配到相应染色体上的标记位点。HAU-DJ-S078匹配到scaffold7300,NAU2687匹配到scaffold3678,HAU-DJ-S168匹配到scaffold1365,NBRI_HQ527767匹配到scaffold4507。本研究对于研究异源四倍体基因组结构以及起源和进化具有重要的意义。2.陆地棉重组自交系群体遗传图谱的构建及产量和纤维品质相关性状的QTL定位以陆地棉DH962和冀棉5号为亲本,构建了一个包含178个家系的陆地棉重组自交系群体。从本研究得到的F2遗传图谱中挑选了所有的SSR、In Del、SNP引物用于重组自交系群体遗传图谱的构建。最终得到一张包含616个位点,全长2016.44c M,标记间平均距离3.27c M的陆地棉种内遗传图谱。该图谱包含59个连锁群,53个连锁群分布在24条染色体上,两个大的连锁群上的大部分标记定位到了同源染色体上,很难区分开来,4个连锁群未能定位到染色体上。连锁群位点数目为2-58个,遗传距离为1.88-104.57c M。通过分析,22.36%的位点发生偏分离(P<0.05),然后对前人发表的研究统计分析,发现陆地棉种内群体的偏分离情况比海陆种间群体严重。该群体在6年8环境下进行种植调查产量和纤维品质相关性状。数据显示,两亲本间除了籽指和衣指外,其他纤维品质和产量等相关性状均存在显著差异。重组自交系群体的各个性状均呈现正态分布,表明该群体适合进行QTL定位。基于重组自交系6年的产量和纤维品质相关性状数据的方差分析结果,发现除了籽指外,其它产量和纤维品质等相关性状都受到极显著环境因素影响;所有性状受到极显著遗传因素影响。通过计算广义遗传率,发现陆地棉的产量和纤维品质相关性状的遗传稳定性相对较低。同时,遗传相关性分析揭示产量和纤维品质各个性状之间存在着复杂的相关性。纤维长度和纤维强度、纤维整齐度之间存在极显著正相关关系,和马克隆值、纤维伸长率、单铃皮棉重、衣分、单株铃数以及衣指之间存在显著负相关关系。纤维强度和纤维长度、纤维整齐度以及籽指之间存在显著正相关关系,和马克隆值、纤维伸长率、单铃皮棉重、衣分、单株铃数以及衣指存在显著负相关关系。除了籽指和衣分存在显著负相关关系,单铃籽棉重和单株铃数之间,以及籽指和衣指之间负相关以外,其他产量性状之间都存在正相关关系。经过复合区间作图法分析,一共检测到134个QTL,分别位于21条染色体和4个连锁群上,其中70个与纤维品质相关,64个与产量性状相关,解释表型变异4.40-15.28%,LOD值为2.50-6.66。分别有10、18、13、16、7、19、20、13、14、2和2个QTL与纤维长度、强度、马克隆值、伸长率、整齐度、单铃籽棉重、单铃皮棉重、衣分、单株铃数、籽指和衣指相关。有9个QTL可以在至少两个环境中检测到,其中5个和纤维品质性状相关,4个和产量性状相关。通过整合分析,检测到26个QTL热点区域分布在13条染色体和2个连锁群上,除去9个多环境检测到的QTL,17个QTL热点区域分别和产量或纤维品质相关。同时也检测到了很多QTL簇分布在15条染色体和2个连锁群上。这些QTL位点的检测为棉花产量和纤维品质相关性状的QTL精细定位及图位克隆奠定了坚实的基础。