论文部分内容阅读
凡纳滨对虾(Litopenaeus vannamei)和栉孔扇贝(Chlamys farreri)是我国重要的海水经济养殖物种。目前,这两个物种的养殖产业都遭受了不同程度的病害侵袭、种质退化等问题。为应对这些难题,必须加快其基础研究,如免疫抗病机制的研究及高产抗逆新品种的开发等。基因组学的研究可以为功能基因研究、分子免疫研究和遗传选育等研究提供有力的技术支持。本研究论文基于本实验室构建的世界上首个凡纳滨对虾和栉孔扇贝的大片段基因组文库BAC(BacterialArtificial Chromosomes)文库,对凡纳滨对虾和栉孔扇贝的基因组进行了信息发掘和应用研究。论文包括以下三个主要部分:1.凡纳滨对虾BAC末端测序的研究。BAC末端测序是了解一个未知基因组的理想手段。在张晓军博士和张洋博士构建完成凡纳滨对虾BAC基因组文库LvHE的基础上,我们从中随机挑选了7812个BAC克隆并使用Sanger测序技术对其进行了双末端测序。在去除载体、污染及低质量序列后,得到11279条高质量BAC末端序列(BES),其中包含4609对双末端序列。所测BES总长为4340753bp,占凡纳滨对虾单倍体基因组大小的0.18%。BES长度范围在100至660bp区间,平均长度385bp。对所有BES进行分析得知凡纳滨对虾为高AT含量(AT含量60.77%)的物种,其基因组内主要的重复序列为微卫星(SSR)和低复杂度序列。二碱基重复和六碱基重复SSR为凡纳滨对虾BES中含量最多的。含量最丰富的转座元件为gypsy,其可能在凡纳滨对虾基因组复制过程中发挥了重要作用。我们通过BLAST成功注释了4519条BES,包括免疫相关基因、性别相关基因及一些生理过程基因等。该结果为功能基因研究、图谱构建及整合、全基因组测序组装等工作提供了重要的资源。2.含有凡纳滨对虾和栉孔扇贝重要免疫基因的BAC克隆的测序。BAC克隆测序是从BAC基因组文库中发掘基因组信息的另一条重要途径,从中得到的信息可以和BAC末端测序的结果互相补充和映证。此外,由于序列较长(~100kb),对BAC克隆的全长测序能够发现一些短序列所不能展示的基因组特征,如基因结构和排列方式、以及一些长的功能元件如长散在重复序列、转座子等等。尽管凡纳滨对虾和栉孔扇贝的免疫基因已经得到了广泛的研究,但局限在mRNA水平和蛋白水平,在DNA水平上的研究却很少。我们对凡纳滨对虾和栉孔扇贝包含免疫基因的BAC克隆进行了全长测序研究,在对序列进行生物信息学分析后,得到了重要的基因组信息,该成果可促进凡纳滨对虾和栉孔扇贝的基因组学、免疫基因及非编码区的研究。我们采用构建PCR池方法筛选到分别含有凡纳滨对虾Toll、hsc70、MnSOD基因的三个BAC克隆,并用Illumina/Solexa测序平台对其进行全长测序及分析。测序总长为125792bp,占全基因组大小比例为0.005%,平均GC含量为37.78%。使用Fgenesh进行基因预测,共得到12个基因,除三个基因(Toll、hsc70、MnSOD)均在相应克隆中找到外,还发现了一些其他重要基因如cuticlin-1、eIF-3、FAM54A、ras GTPase-activating-like protein、RNA polymerase和Upf3regulator of nonsensetranscripts-like protein B等。经REPEATMASKER分析出的重复序列总长为13624bp,占BAC测序总长比例为10.83%,含量最丰富的重复序列为简单重复序列(simple repeats),其次为低复杂度序列(low complexity),散在重复序列(interspersed repeats)的含量最低。在散在重复序列中,反转录转座子(retroelements)含量最丰富,其中LTR元件占比例最大。共计发现了90个1-6碱基重复的SSR,平均每1397.7bp就有一个SSR。绝大多数SSR分布于非编码区,仅3个存在于外显子上。另外发现一个ncRNA:mir-449,可能在pRb-E2F1通路中起负反馈调节作用从而使细胞分裂停滞。我们对前期以高密度膜杂交法筛选到的4个栉孔扇贝的BAC克隆进行了全测序和分析。4个克隆中分别含有hsp70、lgbp(脂多糖葡聚糖结合蛋白)、serineprotease基因和一个具有类免疫球蛋白结构域的基因。所测4个BAC总长为389.98kb,平均GC含量为35.16%,从这些序列中共计预测到34个基因,并分析了蛋白编码区的特征,如基因平均长度、平均外显子数和外显子长度等。发现两个串联排列的lgbp基因位于22kb范围区域内,表明栉孔扇贝中一些免疫基因可能连锁存在。我们还发现了一个膜转运蛋白基因簇,这些基因可能在栉孔扇贝的毒素排出过程中发挥重要作用。进一步分析发现15.43%的BAC序列为重复序列,其中串联重复(tandem repeats)含量最丰富,其次为转座元件,共计发现31个SSR,这些SSR可以为QTL定位和遗传选育工作提供支持。此外发现了一个IS10家族的转座子和一个调控其表达的non-coding RNA基因与其互补重叠存在,这将促进栉孔扇贝非编码RNA的研究。3.凡纳滨对虾和栉孔扇贝重要免疫基因启动子功能研究。在转录水平上的基因调控是由顺式作用元件(如启动子和增强子等)和反式作用因子(转录因子)相互作用完成的。在免疫基因的相关研究中,基因的调控方式更是理解免疫系统这个高度调控体系的关键。目前对虾和扇贝顺式作用元件研究尚十分匮乏。基于BAC克隆全长测序的结果,我们克隆了包括凡纳滨对虾hsc70、MnSOD以及栉孔扇贝hsp70、serine protease、lgbp等基因的5’上游序列,将其克隆入报告基因后转染入昆虫细胞中进行了功能分析,发现凡纳滨对虾热休克同源蛋白hsc70基因(lvhsc70)和栉孔扇贝热休克蛋白hsp70基因(cfhsp70)的5’上游序列可成功的驱动报告基因的表达。以此为基础,我们对其进行了进一步的功能分析。凡纳滨对虾lvhsc70启动子长度为1123bp,克隆到pEGFP-1载体上,并转染昆虫细胞Sf9后,能够顺利驱动报告基因EGFP表达。为确定启动子中行使功能的转录因子结合位点,我们构建了8个启动子系列删除载体,结果显示该启动子中既有进行正调控又有进行负调控的转录因子结合位点。该结果与斑节对虾发表的仅存在正调控元件的结果相异。基于此结果,我们提出了7个片段对转录的调控效应模式。最后,我们通过删除实验研究了一个预测的NF-κB结合位点的功能,发现对其实行缺失突变后其启动表达活性反而上升,提示NF-κB可能负调控凡纳滨对虾lvhsc70的表达。从含栉孔扇贝hsp70的BAC克隆中我们预测到该基因的启动子序列,并对2722bp的序列进行了克隆和功能验证。结果表明该启动子能够成功的在Sf9细胞中驱动EGFP基因表达。进一步的系列删除实验证实了其核心启动子可能存在的区域。该成果将会为lvhsc70和cfhsp70启动子功能性转录因子研究提供支持,并拓展了我们对对虾和扇贝免疫基因调控的知识。