论文部分内容阅读
【目的】利用SNP位点的单拷贝特性,结合陆地棉TM-1参考基因组序列信息,筛选基因组特异的SNP。【方法】以719份遗传背景来源广泛的陆地棉种质资源为材料,采用Illumina公司开发的Cotton SNP63K芯片,利用Genome Studio软件对芯片扫描所获得原始数据进行基因型数据质量控制,获得待测样品SNP位点的基因型数据。根据已公布的陆地棉TM-1基因组的两个版本——中国农业科学院棉花研究所版本Gossypium hirsutum(AD1)genome BGI v1.0与南京农业大学版本G.hirsutum(AD1)genome NBI v1.1为参考序列,对Cotton SNP63K芯片(63 058个SNP)各位点的侧翼序列分别进行全基因组Blast比对分析,以筛选具有单拷贝特性的特异SNP位点并用于样品指纹图谱的构建。【结果】利用Cotton SNP63K芯片对719份材料进行SNP位点基因分型,主要表现为无检出信号的SNP位点、无多态性的SNP位点、具有多态性的SNP位点,而具有多态性的SNP位点的分型结果又可分为单位点SNP(基因组特异SNP)、双位点SNP和多位点SNP。通过对两个已公布的陆地棉TM-1参考基因组序列Blast比对结果表明,中国农业科学院棉花研究所TM-1基因组版本比对获得基因组特异SNP标记为5 474个,而南京农业大学TM-1基因组版本比对获得基因组特异SNP标记仅为1 850个,两者共有的特异SNP为1 594个,进一步通过分型效果、检出率及多态性3个评价指标,筛选score值≥0.7,call frequency值≥0.95,且MAF值≥0.2的SNP位点,获得471个分型效果理想,检出率高且多态性较高的特异SNP位点。在471个SNP位点中,430个位于染色体上,41个位于scaffold片段上。考虑到标记间的连锁程度,剔除连锁标记37个,最终获得393个核心SNP位点。利用393个核心SNP构建了719份品种资源的特征DNA指纹图谱,除个别材料之间遗传背景高度相似、基因型完全一致外,97%的材料均能实现准确有效的鉴别。【结论】筛选出393个基因组特异的SNP,并利用这些核心SNP构建了719份资源材料的特征DNA指纹图谱,为SNP分子标记应用于棉花重要性状遗传改良提供了参考。