论文部分内容阅读
现在人类已经鉴定了超过5000种类型的病毒。某些病毒可直接引起人类疾病,如流感、水痘,以及天花、艾滋病、SARS和禽流感等严重疾病,另外还有一些病毒可作为某些疾病的诱发因子,如疱疹病毒6型可引起一些神经性疾病,某些病毒可能引起人的慢性疲劳综合征。近年来随着新一代测序技术的发展,越来越多的病毒基因组被测序,截止2013年3月,NCBI上已发表的病毒基因组已有3251种。如何利用先进的生物信息学技术分析这些已经发表的海量病毒基因组资源,从而更科学地研究病毒的进化及鉴定分型是我们迫切需要解决的问题。本研究应用最新的贝叶斯-马科夫链的分子进化方法对测序麻疹病毒N基因进行分子进化分析,同时应用基于基因组信息挖掘的基因组条形码技术对肠道病毒进行鉴定与分类,从而将生物信息学技术与病毒学进行交叉融合,为传统微生物学研究技术难以解决的病毒进化及鉴定分型提供崭新的研究视角,并为更好地理解病毒性疾病的发生与发展做出贡献。第一部分基于贝叶斯-马科夫链的麻疹病毒分子进化研究麻疹病毒(measles virus,MV)属于副粘病毒科麻疹病毒属,具有高度的传染性,感染人体后可引起麻疹及严重的并发症,包括巨细胞肺炎、包涵体脑炎等。虽然近年来随着麻疹疫苗大规模使用,麻疹发病率和死亡率大幅度降低,但麻疹在各地的局部爆发仍时有发生,从分子水平对这些爆发的麻疹病毒进行分子进化研究,不仅对鉴定麻疹病毒的基因亚型具有重要意义,也对在分子水平上解释麻疹病毒的局部流行提供科学依据。在本研究中,我们测序了中国吉林地区分离的16株麻疹病毒的N基因,连同从NCBI等序列数据库下载整理所有已发表的麻疹病毒N基因序列,构建出迄今为止最大的麻疹病毒冠状病毒N基因序列数据集。为了检测各株麻疹病毒N基因序列之间是否发生过重组事件,我们采用RDP3(Recombination Detection Program)软件对N基因数据集进行了分析,结果表明在麻疹病毒N基因之间没有发生重组事件。随后我们采用贝叶斯-马科夫链分析方法对麻疹病毒N基因数据集进行分子进化分析。结果显示466麻疹病毒N基因序列被分为两个簇,第一簇中包含A,B,G,H,和C基因型(中国吉林地区的16株麻疹病毒显示为H1基因型),第二簇中只有D基因型,这意味着D基因型有独特的进化特征。我们还估算出麻疹病毒N基因的替代速率是平均每个位点每年发生1.127E-3次替代事件,不同基因型的最大进化祖先出现的时间从20年到45年不等。经贝叶斯-马科夫链中的Bayesian skyline plot方法动态分析研究麻疹病毒N基因的进化特征表明,在过去的近50年间,麻疹病毒N基因进化突变率持续增高,在2009年达到最高水平,随后出现一个明显的下降,现在麻疹病毒N基因的突变速率处于较低水平,与报道的近年麻疹病毒流行统计学数据相符。第二部分基于基因组条形码的肠道病毒鉴定分型研究人类肠道病毒(Human enterovirus,HEV)属于小核糖核酸病毒科,肠道病毒属。HEV可引起多种临床疾病,主要有无菌性脑膜炎、脑膜脑炎、手足口病及心肌炎等等。HEV自从发现后就不断报道其中的某个基因型引起爆发或流行,对人类健康及社会带来极大危害。最初人们根据HEV的致病性和抗原性进行分类,但是这些方法耗时费力,难以对种类繁多的HEV进行准确分型,已经逐渐被基因分型所取代。由于HEV不同基因的进化速率不同,基因分型建立的系统发育树与HEV生物性状经常发生冲突。鉴于测序技术的发展,已经有近400株肠道病毒基因组完成测序。如何从基因组角度挖掘更丰富的信息,开发新型HEV鉴定分型方法势在必行。本研究从基因组的水平出发,利用一种全新的生物信息学技术——基因组条形码技术对肠道病毒进行鉴定分类。我们首先从NCBI下载几种常见的病毒:人类免疫缺陷病毒(HIV)、丙型肝炎病毒(HCV)、流感病毒(Influenza virus)、肠道病毒(EV),然后计算不同病毒基因组的条形码特征向量间的欧式距离,籍此距离对肠道病毒进行鉴定并对肠道病毒建立系统发育树。结果表明:不同的病毒具有不同的基因组条形码图像,其中的异常区域可能为水平转移的基因片段。基因组条形码距离能完全将各种病毒进行分类,并且对肠道病毒的各亚型也能起到很好的分型效果。基因组条形码技术建立的系统发育树与基于VP1使用传统序列比对方法建立的系统发育树具有94%的相似度,通过检索文献资料我们发现基因组条形码技术对柯萨奇A组的某些型别的肠道病毒分类结果更符合此类病毒的致病性,证明基因组条形码技术能够反映出传统基于单基因序列比对无法表现的信息,为一种新型、可靠的HEV鉴定分型技术。