论文部分内容阅读
流感病毒具有多种亚型并对人类造成了巨大的伤害,这根本是由于一些基因重组或基因重配等网状进化事件使得它们可以发生抗原转变的特性。因此,了解一种新型流感病毒是否由一些网状进化事件引起的非常重要,系统发育网络可以分析这些流感病毒的进化历史,这对于研究流感病毒如何在自然环境中变异具有重要意义。使得流感病毒如此流行的另一个因素是它们的两种表面蛋白血凝素HA和神经氨酸酶NA,其会累计小突变引起抗原漂移。预防和治疗流感病毒最有效的方法是疫苗接种。判断一种流感疫苗有效性的方式在于流感病毒和流感疫苗的抗原相似性。本文首先从流感病毒的抗原转变出发,研究了如何构建流感病毒更准确的进化历史,接下来针对流感病毒的抗原漂移,提出了一种利用流感病毒和流感疫苗相似性数据的抗原性预测方法。本文的主要研究内容和贡献如下:(1)当几个网状进化事件同时存在时,现有一些系统发育网络重建方法的性能会下降。基于此,本文提出了一种新的系统发育网络重建方法QS-Net,其利用六个分类单元之间关系的信息。为了评估QS-Net的性能,分别从3个人工序列数据集进行了实验。与其他方法的比较结果表明QS-Net在重建树状进化历史方面与其他方法相当,而在重建网状进化事件方面优于其他方法。此外,各种重建方法还在由36种细菌物种组成的细菌分类数据和22种H7N9甲型流感病毒的全基因组序列组成的真实数据集中运行。实验结果表明QS-Net能够推断出普遍认为的细菌分类学和流感进化以及识别新的网状进化事件。(2)血细胞凝集抑制HI试验反映了被测流感病毒(抗原)和参考流感疫苗(抗血清)之间的抗原相关性。而抗原表征通常基于一个以上的HI滴度数据集。多个数据集的组合导致不完整的高信息矩阵,其中有许多未观察到的条目。基于此,本文提出了一种新的方法NMFAS,其整合流感病毒和流感疫苗的相似性数据来预测H3N2季节性甲型流感病毒数据集中不完整的值。与先前的一些方法相比,NMFAS在10倍交叉验证分析中降低了预测均方根误差RMSE。然后,使用多维缩放MDS构建流感病毒的抗原制图和遗传制图以综合分析它们的抗原和遗传进化,结果表明11个抗原簇能很好地被区分开来。获得的抗原制图可用于流感病毒变异体的鉴定,从而可用于促进流感疫苗的选择。