论文部分内容阅读
一、研究背景和目的中东呼吸综合征冠状病毒(Middle East Respiratory Syndrome Coronavirus,MERS CoV)是导致中东呼吸综合征的病原体,MERS CoV感染的潜伏期为9-12天,可引起发热、咳嗽、气促和呼吸困难等急性呼吸道重症感染症状,常伴有急性肾衰竭,最常见的症状为发热、咳嗽、气促和呼吸困难,在免疫抑制人群中可引起腹泻等症状。据报道,MERS CoV会导致严重的急性呼吸道症状,引起非典型性肺炎,甚至导致死亡,是一种致死率高达40%的经呼吸道传播的病毒。自2012年发现MERS CoV以来,已经在阿拉伯国家引起爆发性疫情,随着疫情规模的不断扩大,死亡病例也开始增多。韩国于2015年4月开始有MERS感染病例,后出现爆发。在此期间,中国广东出现了第一例来自韩国的输入病例。由于MERS CoV的高致死性,越来越多的研究人员开始关注。就目前的患者数据来看,超过97%的病例在中东。有病例报道的20多个国家,均和中东地区存在流行病学关联。根据沙特阿拉伯对402例MERS感染病例的统计资料显示,医务人员感染者占27%,且57.8%的医务人员感染者无症状或症状轻微[1]。由此表明MERS CoV已具备有限的人传人能力,但无证据表明该病毒具有持续直接的人传人能力[2-4]。中东呼吸综合征冠状病毒是一种新型的冠状病毒,2013年5月,国际病毒分类委员会冠状病毒研究小组决定将此病毒命名为Middle East Respiratory Syndrome Coronavirus,即MERSCoV[5]。根据病毒的血清学特点及基因组序列,可将中东呼吸综合征冠状病毒归属于冠状病毒科(Coronaviridae),冠状病毒属Coronavirus的β类C群。病毒体呈多形态,略呈球形,病毒外有囊膜,其表面覆有纤突,使得病毒呈日冕皇冠状。病毒的遗传物质为单股正链RNA病毒,全长约为30.1kb,是现有基因组最大的RNA病毒。至少包含有10个开放阅读框(Open Reading Frame,ORF),分别编码一个大的复制酶多聚蛋白(ORF1a/1b)、表面刺突糖蛋白(Spike,S)、小包膜蛋白(Envelope,E)、外膜蛋白(Membrane,M)、核衣壳蛋白(Nucleocappsid,N)、及5个非结构蛋白(ORF3、4a、4b、5和8b)等[6]。数据库中现有的MERS CoV基因组全序列多为中东地区分离到的毒株,来源为人、骆驼及蝙蝠。而第一株MERSCoV参考株的全基因序列已经发布,GenBank登录号为JX869059[6]。当前对MERS的实验室确诊方法为采用RT-PCR的方法检测呼吸道标本(鼻、咽拭子;痰、气管吸出物)中的病毒,冠状病毒通用引物针对的是上游E基因(upE方法)或开放阅读框ORF1b基因(ORF1b方法)。upE方法的灵敏度高,ORF1b方法特异度高。且与人冠状病毒OC43、NL63、229E和SARSCoV无交叉反应。因此推荐使用upE方法作为筛查,ORF1b方法用作确认试验[7-9]。我国于2015年5月28日发现首例韩国输入性病例并确诊为中东呼吸综合征,至目前为止尚未出现传播及爆发疫情,但其一旦爆发很有可能会造成灾难性后果。我们对MERS CoV基因组序列进行测定有助于了解此输入性病例的MERS CoV基因组结构特点和其生物学特点,帮助了解病毒来源、变异进化、病毒毒力分析等以及与世界其他MERS CoV的遗传进化关系,为中东呼吸综合征的防控提供线索[10-14]。目前对冠状病毒蛋白结构的研究多集中在S蛋白上,其他蛋白的结构与功能还有待进一步的研究,但也已经受到关注。近年来,可通过生物信息学分析获得基因和蛋白质序列中蕴含的重要的信息。本研究在测定完成MERS CoV病毒基因组全序列后,综合利用数据库、网络服务器及生物信息学软件对MERS CoV的RNA、ORF5及E蛋白的理化性质、二级结构、结构域、跨膜结构等参数进行分析,全面了解病毒蛋白与感染、毒力和免疫相关的结构特征,为进一步开展体外免疫学实验筛选和鉴定蛋白提供理论依据。二、研究方法1.样品来源及病毒分离:2015年5月28日广东省惠州市人民医院收治中国首例由韩国输入的中东呼吸综合征疑似病例,临床表现有明显的发热和感染性非典型肺炎症状,经广东省疾病预防与控制中心收集该病例发热过程中不同时期咽拭子样品,并经中国疾病预防与控制中心复核确诊为MERS感染,对收集的样品直接进行病毒RNA提取。2.分子生物学实验:采用试剂盒提取病毒的RNA之后,采用RT-PCR及Nest PCR扩增的方法,利用GenBank数据库中现有的序列信息,使用primer premier5.0软件自行设计24对引物对MERS CoV GD01株的基因组进行分段扩增,对首轮无法扩增的片段进行巢式PCR扩增,并对扩增的片段回收、纯化、克隆,并在此基础上,采用双脱氧链终止法对MERS CoV的核酸序列进行测定。3.生物信息学分析:采用DNAstarV7.0对测序片段拼接,组装成病毒基因组序列后注释提交至数据库,应用BLAST、Bioedit 7、MEGA6.0、SIMPLOT、RDP4等生物信息学软件分析病毒序列的相似性、变异、进化、重组事件。应用网络数据服务器RNAfold对RNA的二级结构进行分析。运用DNAstar软件包中Protean软件的Chou.Fasman和Gamier-Robson方法分析完整E蛋白的a螺旋、β折叠、T转角和不规则卷曲所在区段。分别使用在线网络数据服务器TMHMM和PHYRE server2分别预测融合蛋白的穿膜螺旋和信号肽切割位点。三、结果MERS CoV China GD01株具有冠状病毒基因组的基本特征,测得基因组全序列长度为为29928个核苷酸(nt)。5’端为长134nt的5’UTR(非翻译区);从第29663位的终止密码到3’端,为长266nt的3’UTR(非翻译区)。将测得的将近全长序列的基因组进行BLAST,发现与韩国报道的序列最为接近。而在进行序列比对的过程中,发现不同的测序方法和样品的来源、采集时间也可能对测序结果的准确性造成影响。选用GenBank已公布的不同地区与时间分离到的毒株分别构建了全基因组、S基因、ORF1a的进化树,结果表明三种进化树在反映进化关系方面并无明显差异,病毒核苷酸序列与近期中东地区阿拉伯国家分离到的病毒株序列的相似性高达99.53%~99.92%。通过比对发现在多聚蛋白ORF1ab中有3个新发突变,在S、E、M、N蛋白未发现明显的变异;RDP4和simplot软件重组分析结果表明,病毒的基因组序列无明显的重组现象。对发热第三天(5月28号)的样品进行扩增后,在分析电泳结果时发现,第22对引物除所获得的目的大小的产物,还存在两条不同大小扩增片段。经过纯化、克隆、测序和拼装后,发现样品中除野生型MERSCoV之外,还存在两种缺失突变体,片段大小分别29514bp和29509bp。从发热的第三天开始,持续追溯三天患者咽拭子样品,变异体在发热第五天的样品中即无法检出,发热第二周(第十天和第十三天)的样品中也无法扩增出变异体的序列。通过对基因组序列的比对分析,发现两种序列缺失的病毒,分别缺失了 414bp碱基和419bp碱基,这可能导致部分蛋白结构的改变,出现部分融合或截断。应用生物信息学对基因功能的分析认为机体内可能存在中东呼吸综合征冠状病毒的缺陷干扰RNA。对根据核酸序列翻译出的氨基酸序列进行分析,发现改变主要发生在ORF5和E蛋白上。对其RNA二级结构及蛋白性质进行预测分析,发现缺失的部位多为蛋白疏水性的跨膜结构域。四、结论1.本研究成功扩增出中国第一例韩国输入性中东呼吸综合征冠状病毒的近全基因组序列,再次证实患者感染MERS CoV,并首次在自然人体样品中发现除了 MERS CoV的野生型序列,同时还存在两种缺陷RNA变异体。两种突变体的RNA分别缺失了 414bp碱基和419bp碱基,序列已经提交至GenBank数据库,获得的登录号分别为 KT036372、KT036373、KT036374,命名为 ChinaGD01、ChinaGD01 variant 1、ChinaGD01 variant 2。2.经序列相似性比对和全基因组、S基因、ORF1a的进化分析,证实了China GD01株与韩国分离株的相似度最高,野生株的基因组序列也没有发现重组现象。进化分析的结果也提示此株的来源于沙特阿拉伯地区。三种进化树的比较表明,在全基因组进化树难以构建的情况下,ORF1a更适合研究其进化历程。3.对MERS CoV的RNA二级结构、ORF5蛋白及E蛋白结构进行生物信息学分析,发现ORF5和E蛋白的缺失及融合可能会影响蛋白的疏水性及跨膜结构,E蛋白N端的突变可能会导致病毒毒力的减弱。通过对患者发病期间的样品中突变体含量的检测,发现突变体在发热前期存在,在病情发展后期则无法检出,这一现象也提示MERS CoV的突变体可能与病情发展有关联,为未来研究MERS CoV蛋白相关功能提供线索。