论文部分内容阅读
拟环纹豹蛛pardosapseudoannulata属于狼蛛科豹蛛属,是稻田生态系统中十分常见的广谱性捕食性天敌,在水稻害虫生物控制中扮演重要作用.为避免化学农药带来的不利影响(如“3R”等),开展害虫的生物防治越来越受到重视.由于缺乏蜘蛛基因组方面的研究,关于蜘蛛分子生物学方面的研究较少.本研究首次构建了拟环纹豹蛛雌雄成蛛和亚成蛛的转录组文库,利用Illumina HiSeqTM2500高通量测序平台,采用双末端测序的方法,获得了拟环纹豹蛛10.2Gb的转录组数据,Q30达到82.68%.Trizol法提取样品(雌雄成蛛和亚成蛛混成一个样)总RNA后,利用富含ploy(T)磁珠对总RNA中的mRNA进行富集纯化处理,然后在高温条件下,利用二价阳离子打断mRNA以选取合适大小的目的片段.利用反转录酶和随机引物将mRNA片段反转录形成cDNA第一条链,然后加入缓冲液、dNTPs,在RNase H和DNA polymerase I 的作用下合成第二条cDNA链.对反转录合成的双链cDNA进行末端修复、3’末端加A、连接接头,通过琼脂糖凝胶电泳筛选一定范围大小的片段.然后进行PCR扩增筛选到的片段,琼脂糖凝胶电泳后切取目的片段,使用QIAquick Gel Extraction Kit回收目的片段.最后将处理好的样品进行Qubit和QPCR定量,在芯片(flow cell)表面进行桥式PCR,使DNA片段扩增为单分子DNA簇(此过程在Cluster Station 中进行).单分子DNA簇长好后将flow cell放入IlluminaHiSeqTM2500中,进行测序.测序得到的数据去除杂质数据后利用生物信息学方法进行组装和分析,我们获得了50,516,339对clean reads.通过Trinity组装共得到53,140条转录本和41,993 条Unigenes,其中长度在1kb 以上Unigenes有8,508条,转录本与Unigenes 的N50分别为1,416和1,191.使用Getorf软件对Unigenes进行开放阅读框预测,预测结果中最长的作为该Unigene最终的ORF,从而得到该Unigene对应的编码序列和蛋白序列.利用MISA软件对筛选得到的1kb以上的Unigenes 进行SSR分析,共获得了2,188条简单重复序列.使用BLAST软件将Unigenes 序列与NR(NCBI非冗余蛋白质数据库)、SwissProt、GO(Gene Ontology基因本体数据库)、COG(蛋白质直系同源簇数据库)、KEGG数据库比对,最终获得注释信息的Unigenes有17,676条.获得注释信息的Unigenes中,注释到NR数据库的有17,571条,注释到SwissProt数据库的有12,020条,10,867and 5,494条Unigenes分别注释到GO和COG数据库,6,369条Unigenes注释到KEGG 数据库,并且关联到205条生物学通路.目前,我们的数据提供了拟环纹豹蛛最全面的转录组资源,这些数据也将构成研究狼蛛基因组资源,为今后对拟环纹豹蛛进行基因功能、蛋白质、代谢物等方面的深入研究提供参考.