论文部分内容阅读
随着高通量测序技术的发展及广泛应用,促进了以环境或动物体内全体微生物为研究对象的宏基因组学研究的发展。本研究将病毒宏基因组技术应用到了华南沿海多种重要经济贝类体内的病毒多样性研究中。采用差速离心和超速离心相结合的方法,分别提取于2015年至2016年期间,采自广州省阳江市、湛江市、廉江市、钦州市、珠海市、深圳市牡蛎养殖区的香港牡蛎(Crassostrea hongkongensis)(简称牡蛎样品),以及于2016年6月采自深圳大亚湾海区的,包括贻贝(Mytilus spp.)、文蛤(Meretrix spp.)、毛蚶(Scapharca subcrenata)、栉孔扇贝(Chlamys farreri)等多种贝类(简称大亚湾样品)的总病毒颗粒。用核酸酶去除宿主游离核酸后提取病毒总核酸,经多重置换扩增(Multiple Displacement Amplification,MDA)反应获得了足量DNA,总计构建了79个高通量测序文库,最终获得了233.9 Gb(压缩后)的Illumina测序数据,共97 796 284条reads。利用此数据,我们分析比较了不同测序文库构建方法,应用、评估了多种生物信息学分析工具,并对这些数据进行了深入分析,获得了贝类所携带病毒的多样性信息,增加了对华南沿海重要经济贝类病毒多样性的认识,为贝类病毒研究提供了新的思路和参考。本研究得到主要结果如下:1、建库策略及短序列注释方法的选择宏基因测序文库的构建和序列注释是宏基因组研究的关键步骤,决定着宏基因组研究的质量。本研究分两个试验批次进行了不同策略的病毒宏基因组文库构建方法的比较。研究发现:(1)WTA(whole transcriptome amplification)&WGA(whole genome amplification)方法可将RNA病毒核酸反转录成c DNA,然后和DNA病毒核酸同时进行全基因组扩增,能够在兼顾到RNA病毒研究的同时获得更多核酸量,提高建库成功率。但该方法检测到的RNA病毒比例比单纯使用WTA方法低,说明WTA&WGA方法对DNA病毒、尤其是ss DNA病毒的扩增有偏好性,RNA病毒研究宜采用WTA策略进行专门研究。(2)琼脂糖凝胶回收方法筛选DNA片段所得的文库质量和测序质量更高,应该作为建库的首选方案。但考虑到磁珠筛选法操作简单,进一步结合过滤参数的调整也能获得比较好的测序结果,可以作为备选方案。(3)序列注释方面,我们比较了三种注释工具:BLAST、DIAMOND和Taxonomer,以及NCBI的NR和Uniprot的Uniref两个数据库。综合考虑计算资源和网络速度的限制,我们建议采用DIAMOND配合Uniref数据库的方案对病毒宏基因组数据进行注释,既能保证运行速度也能获得不错的比对效果。2、多地香港牡蛎病毒多样性研究牡蛎样品测序文库构建时采用磁珠法筛选DNA片段,Agilent2100检测结果显示磁珠筛选的片段大小不均匀,DNA片段分布范围在196bp-1435 bp。由于文库质量对测序数据质量有影响,测序Raw Reads中的Q20比例为87.18%,Q30比例为82.12%,测序错误率为0.33%,默认参数下clean reads获得率仅为38.00%,GC含量44.71%。重新调整参数对牡蛎全部Raw Reads重新做了过滤处理,clean reads获得率提高到了60%以上。使用DIAMOND与NR非冗余蛋白数据比对,汇总注释结果显示,病毒序列占9.70%,细胞生物占13.19%,其中包括6.89%的真核生物,5.47%的细菌和少数古菌。DNA病毒文库中注释到的病毒以不可培养的海洋病毒(unculture marine viruses)和蘑菇状噬菌体亚科(Gokushovirinae)为主,RNA病毒文库注释到的病毒则以北海微小核糖核酸病毒(Beihai picobrina-like virus)和北海软体动物病毒(Beihai mollusks virus)为主。同一地区的牡蛎体内病毒种类和含量相似,不同地区之间病毒的种类和含量差异明显,病毒宏基因组的功能(编码基因功能)同样受到地域差异的影响而有所不同。3、大亚湾贝类样品病毒多样性分析大亚湾样品测序文库构建时采用凝胶回收筛选DNA片段方法,此方法建立的文库接头连接效率较高,Agilent 2100检测结果显示DNA片段集中在422 bp,均一性好,文库间差异较小。测序全部reads的Q20比例为92%,Q30比例为84%,测序错误率为0.05%,远高于牡蛎文库构建策略。GC含量平均值是51%,Clean Data的获得率为64.40%。使用DIAMOND与NR非冗余蛋白数据比对,微生物整体注释情况显示:细胞型生物占37.35%,其中细菌占8.94%,真菌占20.45%,注释到的病毒含量相对牡蛎样品较少,仅占1.93%。不同贝类之间病毒含量不同,且病毒宏基因组结构也不一样,这些差异可能主要和样品来源有关。注释到丰度高的病毒有短尾噬菌体科(Podoviridae)、微小噬菌体科(Microviridae)、疱疹病毒科(Herpesviridae)、圆环病毒科(Circoviridae)。结果显示所有样品中均含有大量的不可培养的海洋病毒、不可培养的地中海噬菌体uv MED和少量的环境病毒,但不同贝类样品体内病毒的种类和丰度均不同,病毒宏基因组的功能也因贝类种类的不同存在明显差异。样品DYL、HJ、HL、JL、ML、XH、ZHB中均检测到了较多的贝类疱疹病毒科(Malacoherpesviridae)reads,其中毛蚶样品(XH组)中病毒reads比例达到了15.69%,其中96.1%的reads均为疱疹病毒。这也是首次在毛蚶样品中检测到牡蛎疱疹病毒(Os HV)。