论文部分内容阅读
富含甘氨酸的蛋白根据总体结构可以分为2类:第一类,由大量富含甘氨酸的蛋白质组成(GRPs,>200 AA),其具有超过200个氨基酸的长度,典型的功能是作为细胞壁的结构组件。第二类,富含少量甘氨酸的分泌肽(GRSPs,<200 AA),结构中包含一个典型的信号肽,紧跟信号肽后有一个成熟的富含甘氨酸的肽段。通过之前研究发现,几乎所有的动物,植物和微生物的基因组中都有丰富的GPRs存在。在秀丽隐杆线虫先天免疫中,GRSPs家族的一些成员已被证明发挥重要的作用,在线虫中GRSPs同样重要。 目的: 我们对已发表的线虫GRSPs簇家族成员在免疫反应中的作用十分感兴趣,并且我们更有兴趣知道与了解线虫中是否存在更多的GRSPs以及GRSPs如何响应线虫感染这一过程的。GRSPs的全基因组鉴定会提供两线虫整体的GRSPs进化观。而对线虫先天免疫公共转录数据库进行综合分析将会使我们深入了解线虫GRSPs在先天免疫中的作用。 方法: 1.从UCSC数据库下载线虫C.elegans和C.briggsae全基因组蛋白序列,用于构建两线虫蛋白序列数据库。 2.以先前已报道发现的GRSPs nlp-29,NLP-31,nlp-33,cnc-2,cnc-4和cnc-6作为初始查询对象,应用NCBI中的Blastp与PSI-Blast对这些对象进行分析。运用线虫C.elegans局部蛋白质序列数据库Local-Blastp对线虫GRSPs进行序列分析以鉴定线虫GRSPs。 3.以C.elegans GRSPs作为查询对象,应用GenBank基因组数据库对其它8个物种(包括H.sapiens,D.rerio,D.melanogaster,A.thaliana及D.discoideum)进行查询。 4.运用信号肽预测服务器signal P4.0 server验证包含信号肽的GRSPs肽段。 5.运用 NCBI中的基因表达数据库 GEO(Gene Expression Omnibus)与DRASearch数据库(https://trace.ddbj.nig.ac.jp/DRASearch/)中的短片段 RNA测序项目(PRJNA33023)。 6.为了解GRSPs如何系统地对C.elegans感染并检测线虫感染后可能共表达的GRSPs集簇,从 NCBI中的GEO数据库下载8个与线虫感染生物芯片定量相关转录组数据库(GSE20053,E-MEXP-696,GSE27867,GSE54212,GSE53732, GSE41058,GSE37266以及GSE2740)。同时,使用GEO数据库中的GEO2R工具对差异表达的目的基因进行分析筛选。 7.两线虫 GRSPs信号肽序列通过应用 EBI数据库中多重序列比较的 Log-期望Muscle(multiple sequence comparison by log-expectation)对多序列比对进一步分析。 8.利用程序分子进化遗传学分析软件包 MEGA构建系统进化树以通过检测基因重复情况来分析GRSPs家族的演变规律。 9.对线虫GRSPs蛋白质亚家族I到亚家族XIV编码序列,使用Clustal Omega多序列比对工具手动调整参数分别进行序列比对。 10.使用MEGA6应用程序对核苷酸之间的转换(Ti)/颠换(Tv)的比值(R),同义替换(dS)与非同义替换(dN)的数量,基于密码子的纯化选择Z-测试这些指标进行计算。 结果: 1.对从藻类到哺乳动物的人类10个物种全基因组的比较表明秀丽隐杆线虫(C.elegans)与线虫(C.briggsae)有着非常丰富的富含甘氨酸的分泌肽(GRSPs),其中线虫C.elegans中有110种;线虫C.briggsae中有93种。 2.结果显示大部分 GRSPs簇集在两种线虫基因组[C.elegans中103种(93.64%);C.briggsae中82种(88.17%)],其中C.elegans又可以分为18个簇单元, C.briggsae则分为13个簇单元。C.briggsae中除了有四个GRSPs簇在C.elegans中没有匹配的簇外,在两种线虫基因组中所有其它的GRSPs簇都具有成对的同源保守块。 3.通过对生物转录组数据库定量分析后表明,线虫受到感染后,GRSPs簇在全基因组中广泛的共表达。高度同源编码序列和保守外显子-内含子结构显示紧密的GRSPs簇可能来自局部DNA的复制。 4.纯化选择通过序列对和基于密码子Z-test的总平均数直接进行,显示结果值等于零.整体平均差(dS-dN)小于零,则说明在两种线虫GRSPs家族之间的发生了纯化选择。 结论: GRSPs具有紧密结合的保守外显子-内含子结构,其编码的序列高度保守,并且可能来自局部 DNA复制。在基因组上共线性的 GRSPs簇在进化上具有保守性,GRSPs簇的共表达以及强大的纯化选择可能说明了C.elegans进化的限制,以保证C.elegans能通过GRSPs簇全基因组共表达迅速应对感染。 意义: 在共线性的模块之间基因组进化上的保守性,线虫感染后GRSPs簇的共表达,以及编码序列强烈的纯化选择,这些现象可能意味着对秀丽线虫进化的限制,这用以保证秀丽隐杆线虫通过GRSPs簇的协同表达,协同调节和协同功能,从而通过免疫系统对感染进行快速反应,以抵御病原危害,这对秀丽隐杆线虫的生存与繁衍至关重要。GRSPs蛋白家族对线虫免疫反应至关重要,与其它物种相比,它们在C.elegans和C.briggsae中含量丰富。GRSPs全基因组鉴定将使我们全面了解GRSPs在两线虫中的进化扩增。同时,综合分析C.elegans天然免疫相关转录组数据库,将使我们更好地了解GRSPs在线虫免疫中所起到的重要作用。