论文部分内容阅读
目的:构建贵州省安顺地区蛇源猬迭宫绦虫成虫及裂头蚴转录组数据库,分析成虫与幼虫时期基因表达情况及差异,期望揭示猬迭宫绦虫的转录组遗传信息,为进一步研究该绦虫奠定基础。 方法:①采集安顺地区王锦蛇源裂头蚴,用裂头蚴感染幼犬5只(10条/只),一月后解剖幼犬,小肠内收集成虫。②用 TRIzol法分别提取成虫和裂头蚴的总 RNA,使用 Oligo dT磁珠纯化及分离mRNA,继而对mRNA片段化处理,反转录合成双链cDNA,构建转录组测序文库。采用Solexa RNA-paired-end方法对成虫及裂头蚴cDNA文库进行测序。③用Trinity软件进行组装与拼接,获得unigene。利用生物信息学方法对所得的unigene进行注释,包括与蛋白序列数据库 NR、Swiss-Prot、GO、KEGG和KOG做blastx比对,得到具有最高序列相似性的蛋白,从而得到该 unigene的蛋白功能注释信息。④根据数据库中基因表达量(FPKM值)筛选成虫及幼虫高表达基因,根据基因表达量比值倍数的关系筛选成虫及幼虫差异表达基因及非差异表达基因。 结果:①成虫共得到60,646,568个原始序列、平均序列长度为101 bp,经过严格的过滤处理和质控,保留了58779813个高质量的干净序列、可用序列比例为96.92%、Mapping reads的比例为92.01%,测序质量评估Q20值为94.70%;裂头蚴共得到50740016个原始序列、平均序列长度为101 bp,经过滤保留了47584667个干净序列、可用序列比例为93.78%、Mapping reads的比例为85.70%,Q20值为92.14%;②通过Trinity软件组装,检测样本共得到44047个unigene,平均长度为655.94 bp,成虫及裂头蚴基因的表达丰度分别为67.83%和74.52%;③将样本Unigene与公共数据库中基因进行比对。比对到 NR数据库中的unigene为13954条,占总unigene(44047)的31.68%;④对unigene进行KOG功能分类预测,共有7840个基因被注释上25种KOG分类;⑤通过对KEGG注释,共1786个基因注释到了KEGG代谢通路中,参与了5大类生物过程(有机系统、代谢途径、遗传学过程、环境信息过程、细胞代谢过程)的代谢,共322个代谢通路。该样本注释上基因最多的有5个pathway,共有852条unigene参与,占被注释的基因的47.7%(852/1786),这5个代谢通路的KO号分别为ko03010(参与的unigenes为221条)、ko05016(参与的基因有176条)、ko00190(参与的基因有154条)、ko03040(参与的基因有152条)和ko05010(参与的基因有149条),其中43.8%(373/852)与遗传学过程有关,18.1%(154/852)与代谢途径有关,38.1%(325/852)人类疾病有关。⑥成虫相对于裂头蚴,具有3299个差异性表达基因,其中上调基因1850个,下调基因1449个。通过Blast2 GO软件对差异表达基因进行富集分析,具有显著性差异的基因数为655个,采用 KOBAS网站上提供的超几何检验的统计学方法以基因组显背景进行差异表达基因的Pathway富集分析,发现具有显著性差异的基因数为41个,部分极其显著的GO条目和Pathway通路均为10个。 结论:①高通量的测序技术(Illumina HiseqTM2000i测序仪)可以满足猬迭宫绦虫转录组学分析的要求,其覆盖度、测序深度、测序的准确度都可以得到保证,为今后 RNA水平的研究提供了有力的技术支持,为进一步研究该绦虫功能基因组、遗传机制、新陈代谢以及发现与免疫表达相关的新基因和分子标记等提供了基础数据。②猬迭宫绦虫转录组测序数据与蛋白质数据库NR、SwissProt、KEGG和KOG比对得到的蛋白注释信息,通过包括KOG功能注释,GO功能分类注释、KEGG代谢通路的分析,获得了猬迭宫绦虫基因产物的直系同源性、基因功能分类以及基因产物在迭宫绦虫中的代谢途径等信息。③通过比对发现猬迭宫绦虫的成虫和裂头蚴的基因表达量存在差异,两者间存在大量差异表达基因,这些差异基因具有虫体发育时期的特异性,可能在猬迭宫绦虫的发育、入侵及免疫调节过程中发挥重要的调控功能。