论文部分内容阅读
云南和广西位于我国西南边陲,是我国HIV-1疫情最严重的地区。截止2010年底,两地累计报告感染人数分列全国的第一和第二位。云南省是我国HIV-1流行的发源地,流行毒株的基因亚型很复杂,且处在动态改变的过程中,从最初出现的B(B’)亚型,到印度C亚型的传入,再到CRF01AE从泰国传入,以及CRF07BC和CRF08BC的大量出现而B(B’)和C亚型却在逐渐消失,这些亚型的起源、传播、流行甚至消失所经历的一系列变化,至今仍知之甚少。广西是目前我国艾滋病疫情上升最快的地区,早期主要是在静脉吸毒人群(IDUs)中流行,毒株亚型以CRF08BC为主,但近年来HIV-1迅速从IDU人群向性传播人群扩散,流行的亚型也出现CRF01AE增多的趋势,呈现B(B’)、C、CRF08BC和CRF01AE同时流行的态势。云南和广西东西相邻,同为少数民族聚集区,与之接壤的东南亚国家(泰国、缅甸、越南等)都是HIV-1高度流行的地区,相似的地理位置和社会人口状况,使得两地的HIV-1流行有着紧密的联系。在云南和广西进行HIV毒株的遗传多样性和进化研究,全面、系统地揭示毒株的基因变异和分子进化特征、阐明两地流行毒株之间的关系,对于云南和广西乃至全国艾滋病流行形势的分析、抗HIV药物和疫苗研发等都具有重要意义。本文收集了近2年内确认的分布于云南15个地市的788例和分布于广西13个地市的294例HIV-1感染者的血液标本,通过对毒株gag、pol全长和env C2V3基因的扩增和测序以及部分毒株的全长基因扩增测序,利用MEGA 5.03、BEAST v 1.5.4等多种软件工具和在线分析工具,分析了云南和广西HIV-1流行毒株的变异特点及两地毒株之间的传播和进化关系。一、建立HIV-1 gag、pol全长和env C2V3基因的扩增和测序方法,并对采集的标本进行扩增测序:1、设计扩增和测序引物,优化反应条件,从血标本中提取病毒RNA,采用RT-PCR方法扩增全长gag(1584bp)和pol(3147bp)基因和部分env C2V3基因(558bp)。将gag和pol基因区的序列连在一起,作为一个完整的基因区(gag-pol)(HXB2:790-5096)进行分型分析。2、对标本进行扩增和测序:在云南的788份标本中,gag基因区扩增成功700例、pol基因区扩增成功666例、env C2V3基因区扩增成功692例;在广西294份血浆标本中,gag基因区扩增成功285例、pol基因区扩增成功274例、env C2V3基因区扩增成功283例。病毒载量对扩增成功率有显著影响。二、云南省HIV-1毒株的基因变异和进化特征1、云南省HIV-1毒株的基因亚型及分布:(1)云南省流行的HIV-1毒株种类多样,按照构成比大小依次为CRF08BC、CRF01AE、CRF07BC、未知重组型及C亚型和B(B’)亚型。(2)云南各地HIV-1毒株的分布不同,大致可分为4种:a)以临沧为代表,包括邻近的保山和大理:以CRF08BC为主,占到70%以上,而CRF01AE仅为1/6或更少;b)德宏地区:CRF08BC与CRF01AE的构成比类似,各约占1/4,未知重组型则占到1/3;c)西双版纳和普洱地区:CRF01AE稍多于CRF08BC,二者占到了80%以上;d)昆明和红河地区:CRF08BC比CRF01AE的比例大,CRF07BC所占的比例(分别为18.0%和19.5%)较高,且均有部分未知重组型。(3)未知重组型在少数民族中的所占的比例(17.0%)显著高于在汉族中的比例(6.7%)(P<0.01)。(4)在两种主要传播途径—异性性接触和IDUs中,亚型分布具有显著差异(P<0.01)。在异性性接触途径中,CRF08BC和CRF01AE占主导,分别为52.7%和29.1%,而在IDUs中,CRF08BC亦占到一半,未知重组型和CRF07BC的比例一样,均为15.5%,但CRF01AE仅为5.4%。2、CRF08BC毒株的系统进化特征:(1)异性性接触人群及IUDs人群均未发现同一地区序列完全聚集的现象,表明CRF08BC流行毒株在云南的传播几乎没有地区局限性;(2)在异性性传播人群中,CRF08BC在临沧地区分布较散,与其它地区人群的毒株交叉较多,但有一个相对分开的包括其他5个地区的进化簇,以西双版纳的毒株最多,提示西双版纳的异性性传播人群中可能存在相对临沧独立的人群。(3)在IDUs中,6条红河-IDUs和2条昆明-IDUs序列与广西、云南文山以及辽宁的参考序列聚集成簇,而广西的参考序列(97CNGX6F、97CNGX7F、97CNGX9F)是我国最早发现的CRF08BC毒株,表明红河和昆明的IDUs人群可能是云南最早与广西有传播关系的人群。云南其它地区的IDUs则完全散在分布在异性性接触人群中,系统进化树中没有超过3条序列聚集的情况,表明CRF08BC在云南IDUs人群中的传播没有明显的区域和人群聚集性。3、CRF01AE毒株的系统进化特征:云南的HIV-1 CRF01AE流行毒株在系统进化树中有三个明显的进化簇:簇1为9条临沧-异性性传播人群序列,与7条泰国历史参考株聚集;进化簇2为11条西双版纳-异性性传播人群的序列,与10条越南历史参考株和3条广西现代参考株聚集;簇3为9条西双版纳-异性性传播人群序列,与3条福建现代参考株聚集。其它地区的序列则交叉分散。从各地的流行时间推断,临沧地区的CRF01AE可能来自泰国,西双版纳地区的则可能来自越南,而广西、福建等地CRF01AE可能与西双版纳有传播关系。4、CRF07BC毒株的系统进化特征:42条CRF07BC gag-pol序列与参考株形成一个大簇,新疆2005年的参考株位于簇中,1997年的参考株株靠近簇的外侧。各地的流行毒株彼此交错,无明显聚集,异性性接触人群和IDUs也没有聚集成簇,表明CRF07BC在云南的流行传播无明显地区和人群聚集性。5、未知重组型的鉴定和分布:(1)共发现63株未知重组毒株,占10.2%。重组模式包括3种:B(B’)/C(47例)、CRF01AE/B(B’)/C(12例)和CRF01AE/C(4例)。鉴定出3组具有的相似重组断点的序列,绘制出各组的重组镶嵌模式图。(2)未知重组毒株的分布:传播途径方面以异性性接触(30例)和IDUs(19例)为主。在IDUs中占的比例为15.5%,显著大于异性性传播人群(7.75%)(P<0.01)。在重组模式方面,在IDUs中几乎全是B/C重组(18/19),而在异性性传播人群中CRF01AE/B(B’)/C和CRF01AE/C模式占到了40%(11/28);在地区分布方面,德宏地区的未知重组型最多,占总数的一半,且大部分集中在IDUs人群中;昆明及邻近的红河未知重组型主要分布在异性性传播人群;在感染人数最多的临沧地区未知重组型却非常少。6、gag-pol序列和env C2V3序列的基因离散率和选择压力:(1)gag-pol序列的基因离散率,B(B’)亚型最大(6.15±2.00)%,然后从大到小依次为C亚型(3.09±0.94)%,CRF01AE(2.19±0.36)%,CRF07BC(2.77±0.48)%,CRF08BC最小(1.17±0.31)%。各亚型中gag序列的基因离散率均大于pol序列。在gag基因的编码区段中,各个亚型有相同的规律,即P17与P2P6区段的基因离散率较大,P24区段较小;在pol基因的编码区段中,各个亚型的大小规律有一定的差异。各亚型env C2V3序列的基因离散率均比gag-pol序列大。(2)gag-pol序列所有编码区段的globleω(dN/dS)均<1,受到负向选择压力,各亚型中P17区段的globleω值最大(0.50±0.05),P2P6区段次之(0.36±0.03),其余区段的globleω值均较小。env C2V3序列的globleω值在各亚型中均接近1。无论gag-pol序列env C2V3序列,各亚型之间受到的选择压力均相似。7、env C2V3序列的V3环顶端四肽和辅助受体预测:(1)B(B’)亚型流行毒株的V3环顶端四肽主要以GPGR为主,所占比例为94.7%,而C亚型(CRF07/08BC)和CRF01AE则以GPGQ为主,所占比例分别为97.8%和76.5%,CRF01AE的顶端四肽模式多达6种,相对其它亚型更为复杂。(2)B(B’)亚型流行毒株中可能使用CCR5辅助受体和CXCR4辅助受体的毒株几乎各占一半,而C亚型(CRF07/08BC)和CRF01AE流行毒株则都可能以使用CCR5辅助受体为主,所占比例分别高达98.3%和88.6%。三、广西HIV-1流行毒株的基因变异和分子进化特征1、广西HIV-1毒株的基因亚型及分布:(1)广西流行的HIV-1毒株种类多样,按照构成比大小依次为CRF01AE、CRF08BC、CRF07BC、未知重组型、B(B’)亚型、G亚型。(2)毒株的传播途径分布,CRF01AE在三种主要传播途径中均占优势,在异性性传播占79.5%、在IUDs占58.8%、在同性性传播占71.4%。在异性性传播人群中还有大量CRF07BC、CRF08BC、B(B’)和未知重组型。三种感染途径的亚型构成有显著性差异(P<0.01)。(3)异性性传播是广西最主要的HIV传播途径,在这个人群中CRF01AE毒株的比例在10个地区都超过80%,在4个地区为100%,仅在南宁、钦州和百色为50-60%。异性性传播人群中CRF07BC和CRF08BC仅占6.3%和10.6%,其中CRF07BC绝大部分在南宁,CRF08BC则主要分布在南宁和崇左。2、CRF01AE毒株的系统进化特征:在系统进化树上,按照N>3,Bootstrap值>70%的原则,发现CRF01AE毒株形成2个较大的进化簇(簇1、簇2)和2个较小的进化簇(簇3、簇4)。簇1中没有国外的参考序列,簇中广西和福建参考序列都是年代较近的序列,而簇2中的参考序列大部分为越南早期的序列,而3条广西参考株包括了1997年最早在广西发现的参考株(97CNGX2F),由此推断,簇1中的流行毒株可能源自国内,而簇2中的流行毒株可能源自越南。3、CRF07BC、CRF08BC和B(B’)亚型的系统进化特征:CRF08BC毒株以来自南宁地区为最多,通过系统进化树分析,发现其它地区的毒株序列均与南宁的毒株序列聚集在一起;CRF07BC的进化簇也以南宁的序列占优势,其它地区的序列与之聚集,其中有一个由8条来自南宁异性性传播人群的序列聚集在一起的进化簇,表明南宁可能存在CRF07BC毒株的局部流行。4条B亚型序列中,河池的2条序列与泰国B亚型参考序列聚集,而且这两条序列形成了一个Bootstrap值为99%的进化枝,表明二者很大可能为传播关系。4、未知重组毒株的分析:共发现7株未知重组型毒株,占2.6%。7株中有6株以CRF01AE为母株与B和(或)C亚型毒株重组,其中01AE/B重组3条,01AE/C重组1条,01AE/B/C重组2条,与CRF01AE是当前广西地区流行的主要毒株有关。还发现了1例在gag-po l区由CRF07BC和CRF08BC毒株重组形成的的二代重组毒株,基因序列分析显示该毒株是以CRF07BC为骨架,在pol区有两段794bp和782bp的CRF08BC片段插入。5、gag-pol序列和env C2V3序列的基因离散率和选择压力特征:(1)gag-pol序列的基因离散率,B(B’)亚型最大(4.41±2.18)%,然后为CRF08BC(2.72±0.52)%,CRF07BC(2.37±1.04)%,CRF01AE最小为(2.09±1.16)%。除B(B’)亚型外,其它亚型中gag序列的基因离散率均大于pol序列。在gag基因的编码区段中,P17与P2P6区段的基因离散率较大,P24区段较小,在pol基因的编码区段中,各个亚型的大小规律有一定的差异。各亚型env C2V3序列的基因离散率均比gag-pol序列大。(2)gag-pol序列所有编码区段的globleω(ω= dN/dS)均<1,受到负向选择压力,各亚型中P17区段的globleω值最大,P2P6区段次之,其余区段均较小。各亚型之间受到的选择压力均相似。6、env C2V3序列的V3环顶端四肽和辅助受体预测:(1)B(B’)亚型流行毒株的V3环顶端四肽主要以GPGR为主,所占比例为83.3%,而C亚型(CRF07/08BC)和CRF01AE则以GPGQ为主,所占比例分别为100.0%和71.2%,CRF01AE的顶端四肽模式多达7种,相对其它亚型更为复杂。(2)C亚型(CRF07/08BC)和CRF01AE流行毒株均以可能使用CCR5辅助受体为主,所占比例分别高达100.0%和91.5%。四、广西HIV-1主要流行毒株与云南毒株的传播关系及其起源时间云南和广西HIV-1流行毒株的基因亚型均以CRF01AE、CRF07BC和CRF08BC为主,但三种毒株在两地构成比却大相径庭。云南以CRF08BC为主,CRF01AE次之,CRF07BC较少,与之前的报道基本一致,表明云南的HIV-1流行亚型基本趋于稳定;而广西以CRF01AE占绝大部分,CRF07BC和CRF08BC则较少,亚型分布与之前的报道有较大差异,推测广西HIV-1流行亚型可能正在发生改变。本部分研究,通过系统进化的方法分析广西HIV-1主要流行毒株与云南流行毒株之间的关系,并运用Bayesian合并理论方法推断广西主要流行亚型的起源时间。1、广西与云南CRF01AE流行毒株的关系及传入时间:第二部分研究中,在广西CRF01AE流行毒株gag-pol序列系统进化树中,我们发现了2个较大的进化簇(簇A和簇B)。将这两簇序列与云南CRF01AE 110条序列以及51条参考序列一起,分别绘制系统进化树,发现广西的CRF01AE流行毒株其中的一簇很可能来自越南,与云南部分CRF01AE流行毒株有一定的传播关系,另一簇来源不明,与云南毒株存在传播关系的可能性较小。广西CRF01AE毒株簇A的gag-pol区段的进化速率为2.68×10-3(95%HPD 2.15-3.12×10-3)替换/位点/年。推算CRF01AE传入泰国的时间为1982.4年(95%HPD 1980.1-1986.3),传入越南北部和广西的时间为1996.3年(95%HPD 1994.7-1997.0)。广西CRF01AE的簇A可能由福建传入,并可能存在多个时间点的传播事件,而且该簇毒株进入我国的时间要早于CRF01AE流行毒株从越南北部传入我国广西。簇B流行毒株gag-pol区段的进化速率为2.56×10-3(95%HPD 2.26-2.88×10-3)替换/位点/年,推测簇B毒株传入越南北部和广西的时间为1993.1年(95%HPD 1991.4-1995.1)。CRF01AE簇B株在1993年左右从越南北部传到与之接壤的我国广西崇左,以及邻近的北海、防城港和钦州地区,逐渐向中部的南宁扩散,在1996年左右传入河池地区。2、广西与云南CRF07BC流行毒株的关系:从进化树上可以看到,广西CRF07BC流行毒株形成了3个可靠的进化簇(Bootstrap值均为99%),仅簇1同时有云南和广西的序列,但云南的毒株为偶发的职业暴露感染,簇2和簇3都为广西内部的序列聚集成簇,提示当前广西的CRF07BC流行毒株与云南的流行毒株存在直接传播关系的可能性较小。CRF07BC流行毒株gag-pol区段的进化速率为1.84×10-3(95%HPD 1.49-2.19×10-3)替换/位点/年。CRF07BC流行毒株进入广西的时间为1991.4年(95%HPD 1990.0-1994.6)。广西的CRF07BC流行毒株形成了3个较可靠(后验概率>0.7)的次级进化簇(簇1、簇2、簇3)。推测簇1中的毒株源于云南。簇2祖先株形成时间(tMRCA)为6.2年(95%HPD 4.7-7.0)、簇3祖先株形成时间tMRCA为5.8年(95%HPD 3.8-6.5)。推测广西CRF07BC流行毒株的起源时间在1991年左右,来源相对复杂,最早的来源可能为云南,而在南宁流行的部分毒株可能为2004年左右传入,来源尚不能确定。3、广西与云南CRF08BC流行毒株的传播关系:大部分广西CRF08BC序列均与广西1997年的参考序列聚集在一起,仅有少数序列与云南的序列聚集。推测云南的CRF08BC通过IDUs传入广西百色,由于奠基者效应,形成了与云南不完全相同的相对独立的流行。我国CRF08BC流行毒株gag-pol区段的进化速率为2.44×10-3 (95%HPD 2.10-2.78×10-3)替换/位点/年,起源时间为1993.0年(95%HPD 1990.3-1994.6)。广西CRF08BC流行毒株有22条与广西1997年的参考株聚集成簇(后验概率>0.7),最近祖先形成时间(tMRCA )即为CRF08BC传入广西的时间,为1997.3年(95%HPD 1996.1-1997.4)。该簇毒株与2000年云南文山和红河的参考株形成可靠的进化簇,可以推测,广西CRF08BC流行毒株由云南的文山、红河等地传入。另外,广西CRF08BC流行毒株大部分只与最早进入广西的参考株聚集,而与云南的CRF08BC流行毒株分开,再次提示CRF08BC进入广西后,由于奠基者效应,形成了相对于云南独立的流行。