论文部分内容阅读
血吸虫病人兽共患,分布广泛,危害严重。上世纪90年代,巴西、中国的的科学家分别在曼氏血吸虫和日本血吸虫的基因组测序及注释方面取得重要进展,获得大量有关血吸虫基因组一般生物学意义的大量信息。本研究则针对血吸虫生活史复杂,其生长发育过程中虫体呈现显著的生理学和形态学变化的特点,以在我国流行的日本血吸虫为对象,利用大规模、高通量的基因分离分析技术,开展了不同发育阶段虫体差异表达基因分离、鉴定和解析研究,为从分子水平阐明血吸虫生长发育及其与宿主相互作用的机制建立重要基础,为疫苗和药物研究开拓新途径。主要研究结果概述如下:一、日本血吸虫7d童虫消减cDNA文库的构建及测序分析利用抑制性消减杂交(SSH)技术,以日本血吸虫7天童虫为实验组,42天成虫为驱动组,首次构建了日本血吸虫早期童虫期别差异表达消减cDNA文库。获得的文库重组率为90%,大部分cDNA插入片段在500bp左右。从文库中选取6000个克隆测序,得到5474个ESTs信息,EST大小大多在300-900bp之间,平均长度为571bp。使用在线的PHRED工具对EST进行拼接,得到1764条clusters,包含456个contigs和1306个singletons。所得的Clusters数量约占日本血吸虫基因组的11~8.8%(预计血吸虫表达基因为15000~20000个)。利用半定量PCR验证在童虫消减文库所获呈高表达的四跨膜蛋白(Tetraspanin)、细胞色素氧化酶C (cytochrome C oxidase)、还原型辅酶脱氢酶(NADH dehydrogenase)、热休克蛋白90(HSP90)、可溶性血管内皮细胞生长因子受体(Soluble vascular endothelial cell growth factor receptor)和IBI protein基因在7天童虫和42天成虫中的表达情况,结果显示,这些基因在童虫中的表达量均高于成虫。在日本血吸虫基因组数据库报道的数量有限的童虫期别差异表达基因(156条clusters)也与我们的clusters一致。这都说明本研究构建的童虫消减cDNA文库具有较高的质量。将所得的1764条Clusters与日本血吸虫基因组数据库(http:// function. chgc. sh. cn/ sj-proteome/ index. htm)进行比对,结果显示,65%(1146条)的clusters与已知日本血吸虫基因组序列一致或相似,35% (617条)clusters在日本血吸虫数据库中未见报道,约占日本血吸虫基因组的4.1%到3%。将617条日本血吸虫数据库无匹配的clusters与曼氏血吸虫数据库(http://www.sanger.ac.uk/Projects/S_mansoni/)进行比对,结果显示仅有92条clusters与曼氏血吸虫同源,525条clusters在曼氏血吸虫中也未见报道。把与已知血吸虫数据库均无同源的clusters与NCBI的Nr数据库(http:// www. ncbi. nlm. nih. gov/ blast/ Blast. cgi)比对,有211条clusters和数据库无任何同源性,提示他们可能是血吸虫特有的新基因。利用生物信息学技术对1764个clusters的初步分析表明虽然只有约7.5%的cluster可查询获知其功能,但显示这些clusters都具有重要生物学意义。对所有功能明确的基因进行go分类,结果显示,所占比例最大的三类分别为:代谢进程(Metabolic process)相关分子,占31%;调节生物进程(Regulation of biological process )相关分子,占12%,胚胎发育(Embryonic development)相关分子,占11%。通过与秀丽杆线虫同源性比对进行KEGG信号通路分析,表明有175条clusters参与到糖酵解(Glycolysis)、氨基酸代谢(Amino acid metabolism)、花生四烯酸代谢(Arachidonicacid metabolism)、嘌呤代谢(Purine metabolism)等代谢途径和细胞通讯(Cell Communication)、泛素生物合成(Ubiquinone biosynthesis)、尿素循环(Urea cycle)、氧化磷酸化(Oxidative phosphorylation)、磷酸戊糖途径(Pentose phosphate pathway)、碳固定(Carbon fixation)、蛋白酶体(Proteasome)、泛素调节的蛋白质降解(Ubiquitin mediated proteolysis)等25条信号通路中。值得一提的是,参与抗寄生虫药物丙体六氯苯降解途径(gamma-Hexachlorocyclohexane degradation)中的重要基因之一dehydrogenase与文库中chgc_new_contig406基因同源;对维持日本血吸虫在宿主血管内的生存极为重要的血管内皮细胞生长因子受体(soluble vascular endothelial cell growthor receptor)也在差异表达基因中出现。二、日本血吸虫不同发育阶段差异表达基因研究为分析日本血吸虫不同发育阶段差异表达基因状况,将5000个日本血吸虫cDNA克隆(4000个来自7d童虫消减cDNA文库的克隆和1000个来自尾蚴、雌雄虫、成虫和虫卵消减cDNA文库的克隆)定制cDNA芯片,每个克隆在芯片上重复点样3次。以7d虫体cDNA为对照,分别和日本血吸虫6个不同发育阶段(7d,13d,18d,23d,32d,42d)和42d雌虫、42d雄虫cDNA进行双通道杂交,每个阶段的样本做3次生物学重复。对每个基因杂交得到的9个杂交信号值(ratio值)用SAM软件进行分析,假阳性率(FDR)控制在5%以内,再以2倍标准筛选差异表达基因。7d虫体样本的自身杂交结果说明芯片平台可靠。再选择18个芯片杂交显示差异表达基因进行real time PCR验证,结果和芯片结果基本相符。芯片杂交结果归纳如下:1.发现了一批不同发育阶段差异表达的基因。芯片杂交结果显示,和7d虫体相比,13d虫体差异表达克隆有34个,代表22个基因,其中上调基因4个,下调基因18个,未知基因2个;18d虫体差异表达克隆有238个,代表123个基因,其中上调基因86个,下调基因37个,未知基因9个;23d虫体差异表达克隆有244个,代表136个基因,其中上调基因47个,下调基因89个,未知基因7个;32d虫体差异表达克隆有186个,代表99个基因,其中上调基因46个,下调基因53个,未知基因7个;42d虫体差异表达克隆有158个,代表95个基因,其中上调基因54个,下调基因41个,未知基因4个;42 d雌虫差异表达克隆有671个,代表基因262个,其中上调基因54个,下调基因208个基因,31个未知基因;42d雄虫差异表达克隆有171个,代表115个基因,其中上调基因94个,下调基因21个,未知基因8个。2.聚类分析表明差异基因主要归为9类变化趋势。这9类基因的变化进行深入分析可能可发现一些与虫体发育过程中生物学变化特点相关的信息或线索。go的功能分析显示,合抱前虫体(13天,18天)的差异表达基因参与转录调节活性(transcription regulator activity),代谢(metabolism),结合(binding),蛋白水解(proteolysis)相关;而合抱之后的虫体(23天以后)差异表达基因,除了与代谢(metabolism),转录调节活性(transcription regulator activity),生物合成(biosynthesis)等基本的生物学功能之外,出现较多的是与有性生殖(sexual reproduction),配子发育(gametogenesis),生殖(reproduction),产卵(oviposition)等相关的基因。这些特点的出现正和日本血吸虫发育特征相符合。23天之后的虫体处于雌雄虫合抱、性成熟,生殖产卵阶段。3.尽管目前大部分血吸虫基因都没有明确注释,对在本研究所发现的一些已知功能的差异表达基因进行功能分析发现他们在血吸虫生长发育过程中具有重要功能。一些已经得到公认的疫苗候选分子如谷胱苷肽S转移酶(glutathione S-transferase),Sj23(23 kDa integral membrane protein ),Ca2+结合蛋白(calcium binding protein),四跨膜蛋白( tetraspanin TE736),sm20,参与重要信号通路的RAS相关蛋白,参与PKC信号通路的蛋白,一氧化氮合成酶蛋白抑制剂(neuronal nitric oxidse synthase protein inhibitor),丝苏氨酸蛋白酶抑制剂等在本研究中也被证实在不同发育阶段呈差异表达。这也提示,血吸虫差异表达基因包括一些功能不明确的差异表达基因,都具有深入研究的价值。三、日本血吸虫新基因sj-fibrillin和sj-COG8全长cDNA的克隆与分析选择两个来自7d童虫消减cDNA文库中与数据库中已知基因无同源的日本血吸虫EST:SSH52.D11和SSH33.A7进行克隆和生物信息学分析。根据SSH52.D11的EST序列,利用RACE技术扩增得到全长2251bp的cDNA序列,含有完整ORF,大小为2058bp,编码685个氨基酸,理论分子量为79519.9,等电点为5.22。用Interpro程序(http://www.ebi.ac.uk/Interproscan)对SWISS-PROT数据库进行检索,发现该蛋白含有多个表皮生长因子功能域(EGF like domain)和表皮生长因子样钙结合位点(EGF-like calcium-binding site),与Fibrillin蛋白家族的特点相符合(Timpl et al.,2003),推测其属于结构蛋白Fibrillin家族,命名为sj-fibrillin。经查询表明,该基因为日本血吸虫新基因,Genbank登录号分别为1067183(08年6月公开)。分别提取7d,13d,23d,42d的虫体总RNA,选择tublin作为内参,利用荧光定量PCR法对该基因在日本血吸虫不同发育阶段虫体中的表达情况进行实验验证,结果表明该基因在7d童虫的表达量最高。选取人homo(Genebank登录号1335064),小鼠mus musculus(Genebank登录号118136302),光滑爪蟾Xenopus laevis(Genebank Accession number 83628282)等12个物种的fibrillin蛋白进行进化树分析,结果显示日本血吸虫的fibrillin蛋白在进化上与小鼠最接近。对该基因编码蛋白的三级结构预测表明和人的fibrillin蛋白结构相似。该基因编码的蛋白作为细胞骨架蛋白Fibrillin基因在童虫时期高表达,可能与童虫快速生长,旺盛的细胞分化有关。根据SSH33.A7的EST序列,利用RACE技术扩增得到全长2505bp的序列,含有完整的ORF,大小为2160bp,编码719个氨基酸,理论分子量为85160.4,等电点为5.03。经查询,该基因为日本血吸虫新基因,Genbank登录号为EU131676.1。分别提取7d,42d的虫体总RNA,选择tublin作为内参,利用荧光定量PCR法检测表明,该基因在童虫中的表达量高于在成虫中的表达量。利用NCBI的CDD程序(http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml)对该蛋白的保守结构域进行搜索,结果显示该蛋白含有高尔基体寡居蛋白组分8(COG8)的保守结构域Dor1。选取人Homo sapiens (GeneBank登录号21166361),小鼠Mus musculus(GeneBank登录号66392581),斑马鱼Danio rerio(GeneBank登录号61806582)等8个物种的COG8蛋白,进行保守结构域的分析和比较。并使用最大简约法(MP)绘制进化树进行分析。结果显示,该基因编码的蛋白属于寡聚蛋白家族,并与寡聚蛋白组分8(COG8)相似,推测该基因编码日本血吸虫高尔基体寡聚蛋白组分8,命名为Sj-COG8。COG蛋白是果蝇精子发育中的重要蛋白,与动物性腺发育相关。该蛋白在日本血吸虫童虫时期高表达可能在虫体性别发育中发挥重要作用。综上,本研究首次构建了日本血吸虫早期童虫期别差异表达cDNA消减文库,发现了一批早期童虫差异表达基因、不同生长发育阶段虫体差异表达基因及日本血吸虫新基因的信息;分析显示一批在日本血吸虫不同生长发育阶段差异表达的基因在血吸虫生长发育中具有重要功能。克隆鉴定了sj-fibrillin和sj-COG8两个童虫期高表达的日本血吸虫新基因。本文结果既丰富了日本血吸虫基因组学的研究,更为分离、鉴定血吸虫生长发育关键分子、为从分子水平阐明血吸虫生长发育机制及血吸虫与宿主相互作用的机制提供了重要基础,为抗血吸虫病疫苗和新治疗药物的研制开发开拓了新途径和新思路。