论文部分内容阅读
1扇贝科10个物种的系统发生基因组学分析扇贝有大约400个现存种,是双壳贝类中重要的一支,广泛分布于世界的各大洋中,并且具有重要的经济价值。然而一直以来,许多扇贝种类的系统发生关系都存在分歧。传统的系统发生研究主要依赖于化石记录和形态学特征。随着分子生物学及其技术的发展,通过揭示分子水平的变异来研究系统发生时产生了分子系统发生分析,但以往所运用的有限基因包含的信息往往不完整且相互矛盾。新一代高通量测序技术的出现为这种现状带来了转机,因为这些技术可以应用于任何模式及非模式生物,将会极大促进扇贝的遗传学和基因组学研究,为重建物种间进化关系的研究提供海量的分子性状。这里,我们应用2b-RAD技术,结合高通量测序和II B型限制性内切酶的特点,将获得的大量全基因组范围分布的标签序列用于分析系统发生关系。利用此方法,我们首次对扇贝科10个物种在全基因组水平上分析了它们的系统发生关系。结果表明,利用标签序列构建的系统树与经典方法的结果相符;华贵栉孔扇贝、大西洋深水贝和褶纹肋扇贝可能保留了更多祖先基因组的特征;地理上相距甚远的物种仍有可能具有较高的基因组相似度。2虾夷扇贝的转录组测序和分析我们利用454GS-FLX技术对虾夷扇贝的转录组进行了测序,测序共产生805,330条有效序列,拼接获得32,590条contig,平均测序深度5.8X。将拼接后的序列与公共数据库进行BlastX,获得了25,237个unigene;GO分类和KEGG代谢通路定位表明这些基因涵盖了各个生物学功能和代谢途径,并从中获得了大量生长,繁殖和免疫相关的候选基因。生物信息学预测共获得49,199个SNP和2,748个SSR,可用于标记开发。表达谱分析共获得122个在红色闭壳肌虾夷扇贝和白色闭壳肌虾夷扇贝中差异表达的基因,包括多种结构蛋白、结合蛋白、调控因子等。一些基因可能参与类胡萝卜素积累和转运的调控,另一些则可能是类胡萝卜素积累后引起的变化。与栉孔扇贝的比较转录组分析证明了二者在整体水平上的相似性,进一步的同源序列比较获得了148个可能的快速进化基因,包括血影蛋白、锚蛋白和热激蛋白Hsp90等。推测上游调控因子可能在双壳类的进化中发挥重要作用,并且一种分子的变异很有可能导致与之紧密联系的另一些分子的变化。3虾夷扇贝全基因组框架图的绘制虾夷扇贝的基因组含量为1.47Gb,本研究采取全基因组鸟枪法策略,利用新一代高通量测序技术,对虾夷扇贝的基因组进行了从头测序和组装。Illumina测序总数据量为76.7Gb,覆盖度达到52X。组装总长为771Mb,contig N50为4157bp,scaffold N50达到4,800bp。基因组scaffold覆盖了约90%的转录组序列,预测基因总数为21,300,总长122,144,014bp,占scaffold总长的15.8%,平均长度21,301bp。每个基因平均含有4个外显子和3个内含子,平均长度分别为1,511bp和3,420bp。基因的注释效率超过50%。反转录转座子、DNA转座子以及简单重复序列分别占基因组的0.06%,0.01%和0.22%。本研究为虾夷扇贝的基因组学研究提供了大量基因组序列和结构信息,为了解贝类的进化历史、适应环境的分子机制以及生长、发育、繁殖等生物学基本过程提供了重要的资料。与此同时,我们构建了还构建了一个覆盖虾夷扇贝基因组3.3X的fosmid文库,fosmid文库的构建是配合虾夷扇贝全基因组序列组装的重要工作之一,将为物理图谱的构建、基因组测序工作的顺利进行、以及遗传图谱、物理图谱的整合奠定基础,同时也是基因染色体定位、图位克隆所必备的资源。