论文部分内容阅读
SRAP是美国加州大学戴维斯分校Li & Quiros博士在2001年开发的一种分子标记技术。它已被广泛用于遗传图谱构建,基因定位和克隆,作物重要农艺性状的QTL分析和遗传多样性评估等研究方面。由于SRAP引物在设计时不针对特定序列,所以对于基因组序列信息未知的物种SRAP分子标记技术是一种行之有效的基因组研究手段。SRAP技术检测效率高、引物容易获得,短时间内即可构建一张含有几千个SRAP标记的高密度遗传图谱。第二代测序技术正在被频繁用于基因组测序,基因定位和基因表达谱分析。Illumina公司的Solexa测序技术通量高、费用低,可以在一个反应中对成千上万的SRAP PCR产物进行测序,很容易得到SRAP标记的两端序列信息。通过对SRAP PCR产物添加特异标签序列,在测序后可将不同DNA来源的测序结果分开。对于基因组信息已知的物种,可以将带有序列信息的SRAP标记锚定在基因组上;对于基因组信息未知的物种,由于SRAP标记在基因组中随机分布,用带有序列信息的超高密度遗传图谱组装scaffold将会比较容易。本研究以白菜型油菜黄籽沙逊和大白菜DH系RI16杂交建立的F7代重组自交系群体中的92个体及两个亲本为材料,采用三组SRAP引物进行PCR扩增,再通过标记PCR给SRAP PCR产物添加标签序列以区分DNA来源,最后对标记PCR产物进行Solexa测序;选用805对SRAP引物对作图群体进行扩增,用Joinmap3.0软件构建超高密度遗传图谱;在Solexa测序和构建超高密度遗传图谱中存在共用的SRAP引物,根据Solexa序列设计位点特异引物,通过特异PCR验证,将来自相同引物的SRAP标记和Solexa序列对应;用Windows QTL cartgrapher 2.5软件分析Solexa序列在作图群体中的计数分布和超高密度遗传图谱区段代表标记的连锁关系,将Solexa序列整合到超高密度遗传图谱上。通过对添加了标签序列的SRAP PCR产物进行Solexa测序,将SRAP技术和第二代测序技术相结合,构建整合有序列信息并覆盖全基因组的超高密度遗传图谱。该图谱可用于分子标记开发,基因定位和克隆,QTL分析等,对正在进行的芸薹属A基因组物理图谱组装也具有重要参考价值。本研究得到主要结果如下:1.超高密度遗传图谱的构建用805对SRAP引物组合构建了一个包含10个连锁群,由465个区段组成的超高密度框架遗传图谱,总遗传图距为1495.6cM。该遗传图谱包含了9177个SRAP标记和46个SSR标记。通过共同的SRAP标记和SSR标记,将本研究构建的遗传图谱和其他5个遗传图谱进行了比对,从而将10个连锁群对应为R01-R10。2. SRAP PCR产物的Solexa测序为了对SRAP PCR产物进行Solexa测序,本文共设计或选用三组SRAP引物。第一组SRAP引物由14个上游引物和192个下游引物组合而来,共计2688对,该组引物仅对两个亲本进行扩增;第二组SRAP引物由4个上游引物和96个下游引物组合而来,第三组SRAP引物由1个上游引物和384个下游引物组合而来,该两组引物各384对,用于对作图群体的94个个体进行扩增。三组引物共计进行77568个SRAP PCR反应。用三组标签引物在另外77568个标记PCR反应中对上述SRAP PCR产物添加标签序列,三组标签引物根据SRAP上游引物设计而来。标记PCR扩增产物被混合成一个样品后,电泳筛选出其中100-400bp的片段,凝胶回收并纯化后送公司进行测序。测序得到一个1.28Gb的文本文件,包含了超过1千3百万条双末端Solexa序列。利用计算机程序在这些Solexa序列中寻找引物序列,并根据标签引物分成三组,与三组SRAP引物和三组标签引物相对应。3.通过位点特异PCR将Solexa序列与遗传图谱中的特定SRAP标记相对应有165对SRAP引物同时被用于遗传图谱构建和第一组测序分析。由这165对引物产生了532条互不相同的Solexa序列。根据和SRAP下游引物对应的一端的Solexa序列设计位点特异引物,和原来的SRAP上游引物组合,选取F7代重组自交系群体中的16个作图个体的SRAP PCR产物为模板进行扩增。如果扩增结果仅有一条多态性带,且和原SRAP扩增图谱中某一个SRAP标记的带型相同,片段长度小20bp左右,即可将Solexa序列和特定的SRAP标记对应起来。通过设计532个位点特异引物进行扩增,成功地将141条Solexa序列和SRAP标记对应。4.通过与遗传图谱区段代表标记的连锁分析将Solexa序列整合于遗传图谱第二组和第三组Solexa序列中,根据统计结果选择在亲本或F7代重组自交系群体个体间计数差异大的序列用于同遗传图谱进行整合,分别筛选到2172和4243条序列。用QTL软件对Solexa序列在作图群体中的计数和框架遗传图谱的465个区段代表标记进行连锁检验。选择仅与某个特定连锁群存在显著连锁的Solexa序列,将其插入到与之连锁检验时LOD值最大的区段代表标记所在的图谱位置,从而将Solexa序列整合到遗传图上。分别从第二组和第三组Solexa序列中整合了651条和1086条Solexa序列,共1737条。综上所述,本研究将SRAP分子标记技术和Illumina的Solexa测序技术相结合,成功地构建了一张含有9177个SRAP标记,46个SSR标记,并整合了1878条Solexa序列的超高密度遗传图谱,该图谱与已公布的遗传图谱进行了比对。这些标记或Solexa序列代表了芸薹属A基因组中超过1万个基因组位点。该遗传图谱是目前所构建的饱和度最高的芸薹属A基因组遗传图谱。