论文部分内容阅读
[研究背景]狂犬病是由狂犬病毒引起的人畜共患病,表现为急性、进行性、几乎不可逆转的脑脊髓炎。该病宿主动物广泛、呈世界性分布。中国是世界上仅次于印度的狂犬病第二高发国家。从1996年至今,中国的狂犬病疫情进入新的流行高峰,2007年中国狂犬病疫情达到顶峰,全国报告病例3302例。与此同时,狂犬病地理分布的范围和宿主动物的种类也逐步扩大和增加。全国31个省(直辖市)中除西藏、青海之外均有狂犬病疫情的报告,近几年野生动物伤人引发狂犬病的报告也逐步增多。尽管狂犬病在中国已成为严重的公共卫生问题,但与狂犬病流行密切相关的诸多理论和实际问题并没有得到很好的研究。近年来虽有不同的学者开展了狂犬病分子流行病学的研究,但多数局限于系统发生分析。因此,本研究在全国狂犬病主要流行区的七个省(直辖市)收集宿主动物的脑组织标本并进行狂犬病毒核蛋白基因测序,利用核蛋白核苷酸序列进行了包括系统发生分析、空间动力学分析和种群历史分析的综合的分子流行病学研究。本研究从分子水平上了解中国狂犬病毒的时空分布特征、分布分化机制,探讨其与病毒流行、扩散的内在联系,为有效地预防和控制狂犬病在我国的蔓延提供科学依据。[研究目的]1.了解中国狂犬病毒N基因遗传变异特点和进化特征,为研究其与病毒毒力的关系提供基础数据。2.研究中国狂犬病毒间系统发生关系,描述中国狂犬病毒的时空分布特征。3.研究中国狂犬病毒的分布分化机制,探讨其在中国的播散方式和路径。4.重构中国狂犬病毒的进化历史和种群动态,探讨其与疫情流行和扩散的关系,为有效地预防和控制狂犬病在我国的蔓延提供科学依据。[研究方法]1.疫情资料的整理和分析狂犬病疫情资料来自于中国疾病预防控制中心疾病监测信息系统。通过Excel对疫情资料进行整理、分析,了解1996-2008年中国狂犬病流行特征。2.标本的采集、检测和测序本研究在覆盖中国狂犬病主要流行区的7个省、直辖市收集动物(犬、猫)的脑组织标本。利用直接免疫荧光法(DFA)和RT-PCR法对标本进行抗原和核酸检测,获得阳性标本。利用PCR方法对阳性标本进行N基因编码区核苷酸序列的扩增和测序,获得完整的N基因核苷酸序列。3.构建Lyssavirus基因序列信息数据库下载Genbank上所有Lyssavirus序列信息,以PostgreSQL交互式数据库为平台,利用Perl编程语言编制脚本程序,构建包含序列信息、流行病学信息等的Lyssavirus基因序列信息数据库,并利用SQL语言实现对数据的输入、更新、查询、下载等应用。4.序列的整理和分析(1)序列的整理测序结果用ATGC软件拼接后,ClustalX软件进行完全比对;BioEdit软件进行序列的分析和剪切。DNAStar(5.01)软件中MegAlign分别进行核苷酸和氨基酸序列间同源性比较;GeneDoc软件制成核苷酸及氨基酸差异显示图。(2)系统发生分析利用本次试验获得的34条序列和GenBank中的中国代表序列的N基因构造系统发生树。首先用Modeltest检验数据,获得最适模型(HKY)和各种参数值;然后利用PHYLIP软件包的最大似然法(ML)构建特征法系统发生树,bootstrap值设定为100。(3)空间动力学分析对选自中国狂犬病主要流行区的具有明确分离地点的221条N基因序列,利用PAUP的最大简约法(MP)构建系统发生树,结果保存为不带分支长度的无根树;同时用a-z单个字母来表示每条序列的分离地点,再利用MigraPhyla和PAUP的MP法计算迁移事件距离矩阵。利用UniFrac,以带分支长度的有根树和表明分离地点的序列名字作为输入文件,进行主成分PCA (Principal component analysis)分析。根据分析结果判定不同环境(省份)之间的、在进化上的距离、异质性,同时绘制三维空间矩阵。(4)种群动态与进化历史分析基于蒙特卡洛马尔科夫链(MCMC)随机算法,利用BEAST软件对选择的有明确分离年代的我国211条N基因序列进行碱基替换速率、最近共祖先(Tmrca)、种群增长模型和skyline plot分析。根据Modeltest分析结果选择HKY模型,分别选择严格分子钟(strict clock)和松弛分子钟(relaxed clock)模型下的三种种群增长模型一常数模型(constant population size)、指数模型(exponential growth)、对数模型(logistic growth),并计算各参数值和likelihood值。利用likelihood值进行比较,确定种群的增长模型和各参数的值。[结果]1.本研究在广西、贵州、山东、安徽、浙江、江苏、上海收集动物脑组织标本987份,经DFA和RT-PCR法检测后共获得阳性标本34份。对34份标本进行N基因编码区核苷酸序列的扩增和测序,获得长度为1353bp的完整的N基因核苷酸序列。2.基因序列同源性分析显示,34个病毒标本N基因的1353个核苷酸序列同源性为88.9%-100%,推导的氨基酸序列(N蛋白212-450位)同源性为97.6%-100%,说明N基因核苷酸序列的变异主要是同义突变。N蛋白四个抗原位点及Th细胞表位都高度保守。3.ML系统发生树显示:中国狂犬病病毒形成四个独立的进化分支(Clade I-Clade V),每个分支又可细分为不同的进化群。其中CladeⅠ和CladeⅡ包含近年来分离的多数毒株,为优势分支。每个进化分支同时具有地域分布和不同地区毒株混合特征。4.87%的配对地点间没有发生迁移事件。中国狂犬病毒存在分别以江苏、上海和湖南为中心的东部和西南部两个循环圈。白面鼬狂犬病毒存在从江西向浙江的传播。5.基于马尔科夫链的贝叶斯分析显示,CladeⅠ和CladeⅡ分别起源于1992和1960前后,进化速率分别为:1.274×10-3(C195%:8.3705-4-1.2515E-3)和9.629×10-4(CI95%:3.519-4-1.628E-3)。CladeⅠ和CladeⅡ的最适种群模型均为分别为指数模型(exponential population growth)和常数模型(constant population size)。6. CladeⅠ的基因多样性在从1994年开始到1996年上升迅速然后维持稳定期,随后在2001-2003年又形成一个快速上升期,并在2003年达到最高。2004-2005年经历了迅速下降并维持平缓下降的趋势。CladeⅡ基因多样性一直维持稳定的状态,2000年起到2003年经历快速上升,然后2004明显下将并在2005年前后下降至最低点后维持稳定状态。[结论]1.N基因具有高度保守的特性,可能与其结构和功能密切相关。2.目前中国四个进化分支的狂犬病毒(CladeⅠ-CladeⅣ),已形成广泛的地理分布。其分布分化同时存在着地理分散和迁移事件(即基因漂移)两种机制,其中地理分散为中国狂犬病毒播散的主要方式。3. CladeⅠ狂犬病毒起源于1992年,在1994-1996和2001-2003期间以湖南为中心发生广泛的地理分散,并于2004-2008年尤其是2004-2005年在华东地区以江苏为中心发生迁移事件。4.CladeⅡ狂犬病毒起源于1960年,在2000-2003期间发生地理分散,在2004年有迁移事件的发生。5.优势分支CladeⅠ和CladeⅡ在中国相应地区发生的广泛地理播散,对中国的狂犬病疫情发展发挥作用,造成狂犬病疫情从1996年进入新的流行高峰并在2001年和2003年经历了疫情的最快增长。