论文部分内容阅读
流感病毒所造成的人员伤亡和经济损失在世界范围内提高了对其的关注程度,过去半个世纪所积累的相关研究资料为我们对抗流感病毒提供有力武器。流感病毒基因组结构相对简单但变异速率非常快,每年都需要更新相应的预防疫苗,这主要与病毒囊膜表面的两种糖蛋白,血凝素(Hemagglutinin, HA)与神经氨酸酶(Neuraminidase, NA)密切相关。这两种糖蛋白在识别、进入宿主细胞和增殖扩散中扮演了重要的生物学角色。目前研究显示流感病毒发生的糖基化仅为N-糖基化类型。为了研究N-糖基化在流感病毒糖蛋白中的分布规律,位点变化以及不同结构特征的N-糖链对病毒囊膜糖蛋白功能和结合效率影响,本研究采用生物信息学方法展开讨论。在第一部分研究中,本课题收集并比对已报道的17种HA亚型与10种NA亚型氨基酸序列,通过分析糖基化位点的出现位置与保守率发现随着样本量的增加或跨种间传播的产生,该亚型序列集会产生较多的糖基化位点。例如只含有禽流感H4亚型或H6亚型病毒HA的糖基化位点远远少于含有季节性人流感H1N1或H3N2病毒的相关序列集,而随着294NSS糖基化位点的出现某些H3N2病毒的HA中甚至出现了多达11个糖基化位点数目。本研究根据保守性和出现位置推断流感病毒糖蛋白中存在两类糖基化位点:一类在各亚型序列中具有相同位置且高度保守,另一个则存在于各亚型内部且保守率不一。位于HA0裂解位点附近(如H1序列中的27NNST或H8序列中30NGT)与HA2融膜肽附近的(如H1序列集中的498NGT或H5序列集中500NGS)糖基化位点在各亚型中高度保守,除参与宿主免疫系统逃避外还发挥着保护与调节HA0裂解位点与融膜肽等病毒基本生物学功能。此外位于HA1序列C-端即HA的头茎结合部还存在一个除H7和H15亚型外在各亚型中高度保守的糖基化位点。每种亚型中还存在有3-10个不等的糖基化位点,它们受到了所处不同进化枝的影响,保守率从0.1%(如H3亚型中的294NSS(0.15%))到100%不等。值得一提某些高度保守的糖基化位点距离各亚型高度保守的半胱氨酸残基较为接近,这可能与在稳定新生蛋白折叠时二硫键形成需要N-糖链引导的钙联蛋白/钙网蛋白复合体作用相关。NA茎部通常出现2至4个高度保守的糖化位点,其它保守率不一的糖基化位点通常位于NA头部的各种抗原位点附近。位于NA四聚体头部顶端的146N糖基化位点的在各NA亚型中高度保守,有研究显示其与病毒神经毒力密切相关。如同对HA的描述,由于大量记录的H1N1、H3N2、H5N1、H7N2以及H9N2病毒存在导致了N1与N2序列集中出现了多样的糖基化位点,尤其位于头部区域,它们主要参与了免疫逃避。NA的糖基化位点数目受到茎部特异性序列缺失的影响。茎部序列的缺失有可能降低NA的酶活性并降低对临近未感染细胞表面唾液酸糖链的切除能力从而增强子代病毒对临近细胞的感染。除N4、N8与N9外,每种NA亚型都存在3至24个氨基酸与相应1至4个不等的糖基化位点的缺失。有意思的即使亚型内部特异性序列缺失还与与不同HA组合病毒来源有关。本节结果提供了全面而直观的糖基化位点在流感病毒两种糖蛋白各亚型之间的分布及相互关系。本课题第二部分切入H5N1病毒,研究糖基化位点在进化过程中发生于糖结合蛋白的HA与外切糖苷酶的NA中的动态平衡关系。根据序列比对以及统计分析发现其HA与NA各含有12个糖基化位点,而最近五年中HA中糖基化位点逐渐增多并复杂化,而在NA中的影响逐渐降低。在2003年香港再次出现高致病性禽流感致人死亡前,大多数H5N1病毒均属于clade0,HA与NA中不同糖基化位点模式共同存在。这个时期NA包含除极偶然出现的341NGT位点外位于茎部四个和头部七个所有目前已知糖基化位点,而HA则除五个高度保守的糖基化位点外还出现了170N与181N两个位点。从2003年开始世卫组织记录到由三波H5N1病毒爆发造成的数百人死亡和巨大的经济损失,但是截至目前在除clade7外所有只感染禽的H5N1病毒进化枝(即clade3、4、5、6、8和9)中其糖基化模式高度保守。2005年H5N1病毒中clade2.2进化枝在青海湖附近造成上百只候鸟死亡后向西传播并导致欧洲等地部分禽类死亡。2006年中,H5N1病毒首次出现在非洲大陆,继而导致上百人死亡与禽鸟的大量捕杀。目前埃及等地最新出现的clade2.2.1.1进化枝中其HA新增一个糖基化位点:88NVS。除clade2.2.1.1外大多数位于clade2.2中病毒普遍由于T172A的突变缺失170N糖基化位点。据猜测170N的缺失可能会增强H5N1病毒HA对人呼吸道中常见唾液酸糖链的亲和力,相比该进化枝中NA糖基化位点迅速减少仅残留3个。然而目前从中国和越南等地clade2.3.4进化枝中病毒的糖基化位点模式在HA中保守,在NA中较为多变。相反另一大常见进化枝clade2.3.2中以170N的缺失和NA中糖基化位点保守为特征。181N糖基化位点位于HA顶部β-折叠,在所有的人感染病毒中保守禽感染病毒中保守率较低。事实上,所有的181N糖基化位点缺失毒株仅从禽类宿主中分离得到,如clade7.1、7.2或2.2.1.1。这样的结论为研究糖基化位点与宿主特异性的关系提供了启示。在第三部分中本课题通过三维模型构建和分子动力学模拟优化研究糖基化HA与唾液酸糖链的动力学变化特征。HA结合到宿主唾液酸糖链受体是感染过程的首要步骤,不同亚型中结合唾液酸糖链的受体结合域序列高度保守。而170N与181N位点均位于受体结合域附近,也可能参与或影响了受体识别过程。为了探索糖基化HA与SA-α-2,3-Gal/SA-α-2,6-Gal糖链的结合能力,本研究通过对不同程度糖基化HA分子进行16ns分子动力学模拟并采用多种动力学参数分析,发现N-糖链末端单糖残基具有极高的RMSF (root-mean-square fluctuation),意味着N-糖链末端极为活跃。作为具有复杂构象且高分子量的亲水性分子,N-糖链与蛋白中仅由一个共价键相连,这说明N-糖链的存在将影响HA受体结合能力。通过比较唾液酸糖链50ns水溶液分子动力学模拟并间隔5ns进行构象采样将其唾液酸残基进行叠加,发现两类唾液酸具有不同的拓扑学构象,即SA-α-2,3-Gal唾液酸糖链其余部分向左而SA-α-2,6-Gal唾液酸糖链其余部分向右。经过优化的HA和唾液酸糖链体系为随后进行的分子对接试验提供了研究材料。第四部分中,本课题通过分子对接与三聚体HA-唾液酸糖链复合体分子动力学模拟为判断N-糖链在受体识别过程中的影响提供了直观的结论:RBD附近的170N与181N位点的N-糖链所影响范围极大而相应的唾液酸糖链则主要局限于受体结合域附近。在自由或结合状态下都可以了解SA-α-2,3-Gal唾液酸糖链具有线状朝向HA外侧的拓扑学构象,而SA-α-2,6-Gal唾液酸糖链则出现类似鱼钩状的弯曲并朝向Helix200。利用在模拟过程中的容积分析法可以看出两类唾液酸糖链独特的拓扑构象与HA中不同位点的N-糖链相互影响从而造成HA对不同唾液酸糖链的结合差异:181N糖基化位点的缺失有利于结合线状且朝外的SA-α-2,3-Gal唾液酸糖链,而170N糖基化位点的缺失则利于识别鱼钩状且朝向HA轴心的SA-α-2,6-Gal唾液酸糖链。而当糖基化程度更加复杂时,适应HA受体识别域的唾液酸糖链配体构象将更加受到限制。本课题的实验方法和结论还可以推广至流感病毒其它亚型HA受体结合域附近类似糖基化位点的研究。因此本实验结论有助于对疫苗设计、防控病毒扩散和病毒毒力与糖基化位点关系的进一步研究。