论文部分内容阅读
本文着重对粗柄羊肚菌(Morchella crassipes)转录组De novo测序获得的全转录本进行了微卫星序列(simple sequence repeats,SSR)分析。De novo测序共获得转录本43925条,N50 1676bp,平均contig长度达570bp,GC含量48.29%。通过MISA软件对34972个非冗余Uni Gene进行SSR特征和分布分析,按照单碱基最低重复10次,双碱基最低重复6次,三碱基以上最低重复5次的阈值,共计鉴定得到13044个SSR标签,包含在8851个unigen序列中,占总序列数量的25.30%。2858个Uni Gene中含有两个以上SSR的序列,占SSR Uni Gene总数的32.29%,复合型SSR共计1925个,占SSR Uni Gene数量的21.74%。鉴定得到的单碱基SSR最多,8600个,双碱基1526个,三碱基、四碱基、五碱基、六碱基分别为2497、286、78、57个;排除单碱基重复外,三碱基重复序列发生频率最高,占多碱基SSR中的56.18%。SSR序列特征分析表明,单碱基SSR中,A/T发生频率最高,共计发生7076次,占单碱基SSR序列的82.27%,其中A碱基最高发生79次重复;双碱基SSR中,AG/CT发生频率最高658次,占双碱基SSR数量的43.12%,其次为AC/GT 506和AT/AT 331次,CG/CG发生的频率最低,仅31次;三碱基SSR中,ACC/TGG和AGC/CTG发生频率最高,分别为540次和513次,其次为AGG/CCT和CCG/CGG,分别为455和247次,ACG/CGT和AAT/ATT重复频率最低,分别为96和85次;24种四碱基SSR中,发生次超过20次的SSR类型有5中,分别是AAAG/CTTT、AAGG/CCTT、ACAT/ATGT、AACC/GGTT和AAAT/ATTT。占总四碱基SSR中的45.45%;五碱基和六碱基发生的频率较低,总计分别占总SSR Uni Gene的0.88%和0.64%。本文研究表明,平均2065bp的转录组序列中就含有一个SSR标记,粗柄羊肚菌转录组中含有丰富的SSR序列标签,可以进一步用于开发SSR标记引物,应用于羊肚菌种植资源评价和系统发育分析。