论文部分内容阅读
研究背景
中东呼吸综合征(MERS)是由一种高致病性冠状病毒感染引起的呼吸道传染病,2012年9月在沙特阿拉伯首次被发现。该病病死率高、症状不易辨别且缺乏有效的药物治疗和预防策略,现已从主要流行的中东地区逐渐蔓延至四大洲27个国家,具有全球流行的潜在趋势,引起世界各国的极大关注,成为全球公共卫生领域研究难点和热点。2018年2月,世界卫生组织(WHO)决定将MERS纳入WHO研究与发展蓝图计划,以着力推进该领域研究进展。自MERS出现已有八年,目前在流行病学、病原学、诊断防治等方面开展的研究较多并取得一定成果,但在研究内容上多侧重单独研究其流行病学特征或病原学进化动态,研究设计上缺乏对社会经济、气象地理等多种要素时空分布的有效利用,未能综合考虑时空分布异质性等特征,此外欠缺对MERS时空扩散及洲际范围疫源地风险的预测评估。本研究基于最新数据,综合考虑生物、环境、社会学因素的影响,融合空间信息技术、机器学习模型和系统发育地理学分析技术,从个体、群体和分子层面全面开展对MERS的传播动态、风险评估及其病原系统发育地理学研究,研究结果有助于完善目前对MERS流行病学特征的认识,探索疾病早期扩散的促进因子,识别高风险区域和脆弱人群,为不同区域制定针对性的干预策略与措施提供科学指导,为探索MERS传播机制、实验室检测和疫苗研究提供方向,具有重要的公共卫生学意义。
研究目的
1.描述全球MERS的三间分布特征及地理分区,重点比较接触动物感染和接触病人感染的病例特征差异。
2.探讨个体层面影响MERS死亡的危险因素及交互作用,并结合区域环境要素探索群体层面影响MERS扩散的危险因素。
3.结合自然因素和社会因素,采用多种机器学习模型量化MERS-CoV疫源地的分布及发病风险,探索主要贡献因子并绘制风险地图。
4.利用系统发育地理学分析技术完成MERS-CoV的进化家系、时空迁移分析和进化压力位点分析,并将家系信息纳入个体群体层面,进一步探索家系进化对MERS流行特征的影响。
研究方法
1.数据收集收集全球2020年6月1日前所有MERS个案病例,主要来源于世界卫生组织官方报告,并通过联合国粮食及农业组织网站、受影响国家的卫生部门网站和公开发表的论文完成病例信息检索及补充,形成MERS个案流调数据库。同期动物样本阳性检测数据来源于联合国粮食及农业组织及文献检索。人口数据、骆驼密度数据、气象数据、土地利用数据、海拔数据、交通数据等均来源于相应领域官方网站或数据库。所有数据都遵循数据质控要求完成原始数据的清洗、整理和提取加工,形成区域多要素数据库。检索GenBank数据库中2020年6月1日前发布的MERS-CoV的全基因组序列(>30,000bp)及对应蛋白序列,经过采样地区和采样时间的核实确认,形成MERS-CoV分子序列数据库。
2.统计分析
(1)描述全球MERS病例的时空分布和流行特征分区,明确不同感染方式(接触动物感染和接触病人感染)病例的人口学特征和疾病特征差异。
(2)基于logistic回归模型探索与MERS病例结局相关的危险因素,多因素回归分析时考虑重要变量(年龄组、性别和动物接触史)之间的二元交互作用,结果呈现时分别给出其他变量不同等级时对应的效应值。
(3)基于Cox比例风险回归模型,结合人口学信息、生物环境和社会经济因素,对MERS病例在中东地区的时空扩散特征进行评估并探索危险因素。为了直观展示人类病例的时空扩散情况,借助ArcGIS中趋势表面分析模块,以等值线形式绘制中东地区MERS传播的空间趋势图。
(4)结合人口学信息、生物环境和社会经济因素,采用多种机器学习模型对研究范围内MERS-CoV的生态适宜度进行估算。首先按照传统策略,使用增强回归树模型、随机森林模型和支持向量机模型三个基础模型,通过后续模型结果评估比较选择最优模型。其次采用集成学习的策略,使用堆叠方法将上述三种模型做集成学习,以获得比单一模型更优越的泛化性能。基于集成学习模型结果识别出高风险区域,绘制MERS-CoV自然疫源地分布预测图;基于最优基础模型提取重要贡献因子,并运用logistic回归获得重要特征变量的确切效应值。
(5)使用Nextstrain框架进行系统发育分析,研究MERS-CoV的遗传多样性和进化历程,通过系统发育地理学分析明确重要MERS-CoV家系的时空分布特征及迁徙模式。使用PAML软件包用最大似然法对蛋白质基因编码序列进行正选择位点分析。应用统计学匹配抽样方法将分子水平的家系信息与群体和个体发病状况相关联,探讨MERS-CoV的致病性是否随遗传进化或家系转变而变化。
3.使用软件数据分析使用ArcGIS10.5、R3.6.2、Python2.7、Nextstrain、MAFFTv7.407、IQ-Treev1.6.10、PAL2NALv14、PAMLv4.9、CorelDRAWX8等软件和编程环境。
研究结果
1.建立了包含2450例MERS病例的个案病例数据库(包括150个病例集群)。其中,802例患者死亡,病死率为32.73%,69.35%的病例为男性,发病年龄中位数为53岁(四分位数间距为38-65岁),医护人员占病例总数的13.67%。在1453名接触史信息明确的患者中,356名(24.04%)报告有动物接触史。空间分布上MERS病例主要分布于热带地区和北半球,发病数最高的地区为中东地区,以沙特阿拉伯最高,其次为韩国。结合传播模式分类,发现存在接触本地动物感染病例的国家均分布于阿拉伯半岛,虽然欧洲和东南亚地区也报告了具有动物接触史的病例,但均属于输入病例。时间分布上,2014-2015年包含了3次发病高峰,主要源于沙特阿拉伯和韩国的暴发疫情,季节性分布上发现春季(4-6月)存在发病高峰。接触动物感染和接触病人感染两种传播方式产生的病例在人口学特征和疾病特征上存在显著差异,与没有动物接触史的病例相比,接触动物感染的病例病死率更高,男性患者数量更多,年龄更大,患有基础疾病比例更高,从疾病发作到诊断的时间更长,上述特征的差异都具有统计学意义(P<0.001)。而医务人员及无症状患者的感染方式基本是接触病人感染。此外两种传播模式的季节性也不同,接触动物感染病例主要出现在在1-3月,而接触病人感染病例发病高峰紧随其后。
2.死亡危险因素分析显示,年龄≥65岁、男性、中东居民、患有基础疾病以及发病前具有明确动物接触史的病例死亡风险较高。同时年龄、性别和动物接触史间均存在具有统计学意义的双变量负向交互作用,在没有动物接触史和女性病例中,年龄的危险效应更为明显;研究发现死亡风险对动物接触史的依赖性随年龄和性别而变化,动物接触史是<65岁女性患者死亡的独立危险因素。
3.时空扩散趋势分析显示,MERS在2014年4月至2015年底之间自阿拉伯半岛中部迅速传播到周围地区,其中由发源地向阿拉伯联合酋长国和阿曼方向扩散速度最快。公路和铁路交通网络在MERS早期陆路区域内的快速扩散中发挥了重要作用。除交通因素外,海拔、荒地覆盖面积占比和医院数量也是MERS扩散的危险因素。
4.研究中应用的四种机器学习模型在预测MERS-CoV自然疫源地分布上效果均良好,模型应用测试集测试时AUC最低为84.14%,以集成模型效果最优(AUC=91.66%)。以集成模型对整个研究范围做MERS-CoV疫源地风险预测,绘制的风险地图显示自然疫源地主要分布在热带,高风险和中度风险地区跨越中东、西亚、北非和东非小部分,远远大于目前报道的MERS病例或检测到阳性动物样本分布的地理范围;南欧、非洲中部和南部的风险较小,这与在这些地区仅观测到的少数输入性病例或阳性动物样本相符。敏感性分析中,基于仅用阳性数据建模预测的最大熵MaxEnt模型,发现其预测风险分布情况与上述模型基本一致,证明各模型结果合理可信。影响因子贡献度上,我们发现荒地覆盖面积占比是影响MERS-CoV疫源地分布的主要贡献因子,贡献度为30.06%,其次是林地覆盖面积占比(10.74%),人口密度、年平均温度、耕地覆盖面积占比和骆驼密度均为中等贡献变量,贡献度范围为6.20-7.28%。因子反应曲线显示MERS-CoV疫源地分布与较高水平的荒地覆盖面积占比、人口密度、年平均温度和骆驼密度有关,也与较低的森林和农田覆盖面积占比有关。基于上述贡献因子做多因素Logistic回归分析,较高水平的荒地覆盖面积占比效应值最高(OR=23.74),其次为较高水平的年平均温度(OR=4.05)和骆驼密度(OR=1.80)。多因素分析中未纳入森林和耕地覆盖面积占比,由于二者与荒地覆盖面积占比的相关性很高(R>0.6)。此外,多因素研究中未发现荒地覆盖占比、人口密度、年平均温度和骆驼密度之间存在显著的双变量交互作用。
5.系统发育分析表明,人类、骆驼(含羊驼)中检测到的病毒序列形成了主要进化枝,而蝙蝠和刺猬来源的病毒序列形成了与之距离较远的进化枝,表明骆驼是MERS动物宿主。在人与骆驼序列构成的主进化枝中,人类和骆驼的序列在整棵树中混合交叉在一起,这提示从骆驼到人类存在多次引入事件。主进化枝包含编号为C1-C5的五个亚进化枝,其根节点可以追溯到2007年1月,根节点来源骆驼的可能性为49.3%,来源人类的可能性为50.7%。系统发育地理学分析上,主进化枝的时空传播特征主要表现为中东地区内部强烈的局部迁移和偶尔出现的远距离迁移;推断起源地最可能出现的三个位置是沙特阿拉伯的利雅得、尼罗河三角洲地区和约旦,其后验概率分别为31%,17%和12%。利雅得是当地和国际输出感染的主要来源,它是亚进化枝C3、C4和C5(覆盖了所收集序列的97.5%)的共同祖先节点位置的后验概率具有99%。根据序列空间迁移图谱,2011-2012年该病毒从利雅得向沙特阿拉伯其他城市、阿拉伯联合酋长国的阿布扎比和欧洲部分城市迁移,阿布扎比很快加入利雅得,成为第二个病毒输出枢纽;2013-2015年病毒传播最为迅速,自中东输出到北美、非洲和东亚,与实际中2014年中东向美国以及2015中东向韩国的输出事件相符合。位点分析上,研究确定了刺突糖蛋白中可能与正向选择相关的八个氨基酸位置,其中三个是现有认知的新发现位点。将平滑后的地区发病率等指标与人类序列关联后,发现系统进化树中各家系对应病例病死率不同,C5的病死率高于其他进化枝。但将家系信息匹配至个体层面进行死因分析时,家系特征对死亡的作用无统计学意义。
研究结论
1.MERS具有明确动物接触史的病例比例持续上升,且与人传人病例相比,动物传人病例的病死率更高,加强动物中该疾病的监测、防控和治疗应是今后MERS研究的重点,同时加强动物传人病例监测等。
2.MERS病死率较高,其死亡的高风险人群为老年人、男性、中东居民和患有基础疾病的病例,死亡风险对动物接触史的依赖性随年龄和性别而变化,提示应对高危人群加强监测与宣教以预防感染,一旦确诊应及早采取救治措施。
3.交通网络在MERS早期陆路区域内的快速扩散中发挥了重要作用,在与MERS高风险区域交通便利或交流频繁的地区,应在重要交通枢纽中持续加强对MERS的监测与防控。
4.基于机器学习模型进行的疫源地风险预测提示高中风险区包含中东、西亚、北非和部分东非,远远大于现有病例报告的地理范围,未来应加强对应区域的病例监测与干预措施。
5.序列分析发现骆驼是动物宿主,进化中存在骆驼到人类的多次引入事件,检测试剂应该增强对目前占主导的C5家系的识别,刺突糖蛋白中识别到三个现有认知新发现的正向选择位点,可为进一步定位疫苗的潜在靶点和开发MERS-CoV的抗病毒药物提供研究方向。
创新性
1.开展了跨洲际多要素细尺度MERS-CoV疫源地风险评估研究。在对应研究中,我们不仅构建模型预测了动物宿主骆驼的空间分布,而且将接触本地动物感染患者、感染的宿主动物的分布同时纳入模型作为结局变量,以获得更可靠的MERS-CoV适宜生境分布图。我们创新性地采用堆叠方法将多种基础机器学习模型进行集成学习,得到了最优效果的预测模型,大大提高了自然疫源地预测的精度和准确性。目前上述研究在现有公开文献中尚无报道。
2.开展了MERS-CoV空间扩散动态及其影响因素的研究。采用空间趋势面分析、系统发育地理学等多学科交叉的研究方法,从报告病例和病原核酸序列两个方面相互验证,共同揭示了MERS-CoV的空间扩散特征,并定量估算了交通、医院分布等因素对空间扩散的影响,研究结果对于明确重点监测方向、指导MERS防控具有重要科学意义。
3.从多水平多要素全面探索MERS的时空分布及流行特征。研究结合病原数据及相关的生物、环境、社会学要素,形成个体、群体和分子水平三个现有MERS最新的数据库,关注重要因素间的交互作用,完善了目前对MERS流行病学特征的认识,明确了高危人群与高风险地区,为不同区域制定针对性的预防控制措施提供参考。
中东呼吸综合征(MERS)是由一种高致病性冠状病毒感染引起的呼吸道传染病,2012年9月在沙特阿拉伯首次被发现。该病病死率高、症状不易辨别且缺乏有效的药物治疗和预防策略,现已从主要流行的中东地区逐渐蔓延至四大洲27个国家,具有全球流行的潜在趋势,引起世界各国的极大关注,成为全球公共卫生领域研究难点和热点。2018年2月,世界卫生组织(WHO)决定将MERS纳入WHO研究与发展蓝图计划,以着力推进该领域研究进展。自MERS出现已有八年,目前在流行病学、病原学、诊断防治等方面开展的研究较多并取得一定成果,但在研究内容上多侧重单独研究其流行病学特征或病原学进化动态,研究设计上缺乏对社会经济、气象地理等多种要素时空分布的有效利用,未能综合考虑时空分布异质性等特征,此外欠缺对MERS时空扩散及洲际范围疫源地风险的预测评估。本研究基于最新数据,综合考虑生物、环境、社会学因素的影响,融合空间信息技术、机器学习模型和系统发育地理学分析技术,从个体、群体和分子层面全面开展对MERS的传播动态、风险评估及其病原系统发育地理学研究,研究结果有助于完善目前对MERS流行病学特征的认识,探索疾病早期扩散的促进因子,识别高风险区域和脆弱人群,为不同区域制定针对性的干预策略与措施提供科学指导,为探索MERS传播机制、实验室检测和疫苗研究提供方向,具有重要的公共卫生学意义。
研究目的
1.描述全球MERS的三间分布特征及地理分区,重点比较接触动物感染和接触病人感染的病例特征差异。
2.探讨个体层面影响MERS死亡的危险因素及交互作用,并结合区域环境要素探索群体层面影响MERS扩散的危险因素。
3.结合自然因素和社会因素,采用多种机器学习模型量化MERS-CoV疫源地的分布及发病风险,探索主要贡献因子并绘制风险地图。
4.利用系统发育地理学分析技术完成MERS-CoV的进化家系、时空迁移分析和进化压力位点分析,并将家系信息纳入个体群体层面,进一步探索家系进化对MERS流行特征的影响。
研究方法
1.数据收集收集全球2020年6月1日前所有MERS个案病例,主要来源于世界卫生组织官方报告,并通过联合国粮食及农业组织网站、受影响国家的卫生部门网站和公开发表的论文完成病例信息检索及补充,形成MERS个案流调数据库。同期动物样本阳性检测数据来源于联合国粮食及农业组织及文献检索。人口数据、骆驼密度数据、气象数据、土地利用数据、海拔数据、交通数据等均来源于相应领域官方网站或数据库。所有数据都遵循数据质控要求完成原始数据的清洗、整理和提取加工,形成区域多要素数据库。检索GenBank数据库中2020年6月1日前发布的MERS-CoV的全基因组序列(>30,000bp)及对应蛋白序列,经过采样地区和采样时间的核实确认,形成MERS-CoV分子序列数据库。
2.统计分析
(1)描述全球MERS病例的时空分布和流行特征分区,明确不同感染方式(接触动物感染和接触病人感染)病例的人口学特征和疾病特征差异。
(2)基于logistic回归模型探索与MERS病例结局相关的危险因素,多因素回归分析时考虑重要变量(年龄组、性别和动物接触史)之间的二元交互作用,结果呈现时分别给出其他变量不同等级时对应的效应值。
(3)基于Cox比例风险回归模型,结合人口学信息、生物环境和社会经济因素,对MERS病例在中东地区的时空扩散特征进行评估并探索危险因素。为了直观展示人类病例的时空扩散情况,借助ArcGIS中趋势表面分析模块,以等值线形式绘制中东地区MERS传播的空间趋势图。
(4)结合人口学信息、生物环境和社会经济因素,采用多种机器学习模型对研究范围内MERS-CoV的生态适宜度进行估算。首先按照传统策略,使用增强回归树模型、随机森林模型和支持向量机模型三个基础模型,通过后续模型结果评估比较选择最优模型。其次采用集成学习的策略,使用堆叠方法将上述三种模型做集成学习,以获得比单一模型更优越的泛化性能。基于集成学习模型结果识别出高风险区域,绘制MERS-CoV自然疫源地分布预测图;基于最优基础模型提取重要贡献因子,并运用logistic回归获得重要特征变量的确切效应值。
(5)使用Nextstrain框架进行系统发育分析,研究MERS-CoV的遗传多样性和进化历程,通过系统发育地理学分析明确重要MERS-CoV家系的时空分布特征及迁徙模式。使用PAML软件包用最大似然法对蛋白质基因编码序列进行正选择位点分析。应用统计学匹配抽样方法将分子水平的家系信息与群体和个体发病状况相关联,探讨MERS-CoV的致病性是否随遗传进化或家系转变而变化。
3.使用软件数据分析使用ArcGIS10.5、R3.6.2、Python2.7、Nextstrain、MAFFTv7.407、IQ-Treev1.6.10、PAL2NALv14、PAMLv4.9、CorelDRAWX8等软件和编程环境。
研究结果
1.建立了包含2450例MERS病例的个案病例数据库(包括150个病例集群)。其中,802例患者死亡,病死率为32.73%,69.35%的病例为男性,发病年龄中位数为53岁(四分位数间距为38-65岁),医护人员占病例总数的13.67%。在1453名接触史信息明确的患者中,356名(24.04%)报告有动物接触史。空间分布上MERS病例主要分布于热带地区和北半球,发病数最高的地区为中东地区,以沙特阿拉伯最高,其次为韩国。结合传播模式分类,发现存在接触本地动物感染病例的国家均分布于阿拉伯半岛,虽然欧洲和东南亚地区也报告了具有动物接触史的病例,但均属于输入病例。时间分布上,2014-2015年包含了3次发病高峰,主要源于沙特阿拉伯和韩国的暴发疫情,季节性分布上发现春季(4-6月)存在发病高峰。接触动物感染和接触病人感染两种传播方式产生的病例在人口学特征和疾病特征上存在显著差异,与没有动物接触史的病例相比,接触动物感染的病例病死率更高,男性患者数量更多,年龄更大,患有基础疾病比例更高,从疾病发作到诊断的时间更长,上述特征的差异都具有统计学意义(P<0.001)。而医务人员及无症状患者的感染方式基本是接触病人感染。此外两种传播模式的季节性也不同,接触动物感染病例主要出现在在1-3月,而接触病人感染病例发病高峰紧随其后。
2.死亡危险因素分析显示,年龄≥65岁、男性、中东居民、患有基础疾病以及发病前具有明确动物接触史的病例死亡风险较高。同时年龄、性别和动物接触史间均存在具有统计学意义的双变量负向交互作用,在没有动物接触史和女性病例中,年龄的危险效应更为明显;研究发现死亡风险对动物接触史的依赖性随年龄和性别而变化,动物接触史是<65岁女性患者死亡的独立危险因素。
3.时空扩散趋势分析显示,MERS在2014年4月至2015年底之间自阿拉伯半岛中部迅速传播到周围地区,其中由发源地向阿拉伯联合酋长国和阿曼方向扩散速度最快。公路和铁路交通网络在MERS早期陆路区域内的快速扩散中发挥了重要作用。除交通因素外,海拔、荒地覆盖面积占比和医院数量也是MERS扩散的危险因素。
4.研究中应用的四种机器学习模型在预测MERS-CoV自然疫源地分布上效果均良好,模型应用测试集测试时AUC最低为84.14%,以集成模型效果最优(AUC=91.66%)。以集成模型对整个研究范围做MERS-CoV疫源地风险预测,绘制的风险地图显示自然疫源地主要分布在热带,高风险和中度风险地区跨越中东、西亚、北非和东非小部分,远远大于目前报道的MERS病例或检测到阳性动物样本分布的地理范围;南欧、非洲中部和南部的风险较小,这与在这些地区仅观测到的少数输入性病例或阳性动物样本相符。敏感性分析中,基于仅用阳性数据建模预测的最大熵MaxEnt模型,发现其预测风险分布情况与上述模型基本一致,证明各模型结果合理可信。影响因子贡献度上,我们发现荒地覆盖面积占比是影响MERS-CoV疫源地分布的主要贡献因子,贡献度为30.06%,其次是林地覆盖面积占比(10.74%),人口密度、年平均温度、耕地覆盖面积占比和骆驼密度均为中等贡献变量,贡献度范围为6.20-7.28%。因子反应曲线显示MERS-CoV疫源地分布与较高水平的荒地覆盖面积占比、人口密度、年平均温度和骆驼密度有关,也与较低的森林和农田覆盖面积占比有关。基于上述贡献因子做多因素Logistic回归分析,较高水平的荒地覆盖面积占比效应值最高(OR=23.74),其次为较高水平的年平均温度(OR=4.05)和骆驼密度(OR=1.80)。多因素分析中未纳入森林和耕地覆盖面积占比,由于二者与荒地覆盖面积占比的相关性很高(R>0.6)。此外,多因素研究中未发现荒地覆盖占比、人口密度、年平均温度和骆驼密度之间存在显著的双变量交互作用。
5.系统发育分析表明,人类、骆驼(含羊驼)中检测到的病毒序列形成了主要进化枝,而蝙蝠和刺猬来源的病毒序列形成了与之距离较远的进化枝,表明骆驼是MERS动物宿主。在人与骆驼序列构成的主进化枝中,人类和骆驼的序列在整棵树中混合交叉在一起,这提示从骆驼到人类存在多次引入事件。主进化枝包含编号为C1-C5的五个亚进化枝,其根节点可以追溯到2007年1月,根节点来源骆驼的可能性为49.3%,来源人类的可能性为50.7%。系统发育地理学分析上,主进化枝的时空传播特征主要表现为中东地区内部强烈的局部迁移和偶尔出现的远距离迁移;推断起源地最可能出现的三个位置是沙特阿拉伯的利雅得、尼罗河三角洲地区和约旦,其后验概率分别为31%,17%和12%。利雅得是当地和国际输出感染的主要来源,它是亚进化枝C3、C4和C5(覆盖了所收集序列的97.5%)的共同祖先节点位置的后验概率具有99%。根据序列空间迁移图谱,2011-2012年该病毒从利雅得向沙特阿拉伯其他城市、阿拉伯联合酋长国的阿布扎比和欧洲部分城市迁移,阿布扎比很快加入利雅得,成为第二个病毒输出枢纽;2013-2015年病毒传播最为迅速,自中东输出到北美、非洲和东亚,与实际中2014年中东向美国以及2015中东向韩国的输出事件相符合。位点分析上,研究确定了刺突糖蛋白中可能与正向选择相关的八个氨基酸位置,其中三个是现有认知的新发现位点。将平滑后的地区发病率等指标与人类序列关联后,发现系统进化树中各家系对应病例病死率不同,C5的病死率高于其他进化枝。但将家系信息匹配至个体层面进行死因分析时,家系特征对死亡的作用无统计学意义。
研究结论
1.MERS具有明确动物接触史的病例比例持续上升,且与人传人病例相比,动物传人病例的病死率更高,加强动物中该疾病的监测、防控和治疗应是今后MERS研究的重点,同时加强动物传人病例监测等。
2.MERS病死率较高,其死亡的高风险人群为老年人、男性、中东居民和患有基础疾病的病例,死亡风险对动物接触史的依赖性随年龄和性别而变化,提示应对高危人群加强监测与宣教以预防感染,一旦确诊应及早采取救治措施。
3.交通网络在MERS早期陆路区域内的快速扩散中发挥了重要作用,在与MERS高风险区域交通便利或交流频繁的地区,应在重要交通枢纽中持续加强对MERS的监测与防控。
4.基于机器学习模型进行的疫源地风险预测提示高中风险区包含中东、西亚、北非和部分东非,远远大于现有病例报告的地理范围,未来应加强对应区域的病例监测与干预措施。
5.序列分析发现骆驼是动物宿主,进化中存在骆驼到人类的多次引入事件,检测试剂应该增强对目前占主导的C5家系的识别,刺突糖蛋白中识别到三个现有认知新发现的正向选择位点,可为进一步定位疫苗的潜在靶点和开发MERS-CoV的抗病毒药物提供研究方向。
创新性
1.开展了跨洲际多要素细尺度MERS-CoV疫源地风险评估研究。在对应研究中,我们不仅构建模型预测了动物宿主骆驼的空间分布,而且将接触本地动物感染患者、感染的宿主动物的分布同时纳入模型作为结局变量,以获得更可靠的MERS-CoV适宜生境分布图。我们创新性地采用堆叠方法将多种基础机器学习模型进行集成学习,得到了最优效果的预测模型,大大提高了自然疫源地预测的精度和准确性。目前上述研究在现有公开文献中尚无报道。
2.开展了MERS-CoV空间扩散动态及其影响因素的研究。采用空间趋势面分析、系统发育地理学等多学科交叉的研究方法,从报告病例和病原核酸序列两个方面相互验证,共同揭示了MERS-CoV的空间扩散特征,并定量估算了交通、医院分布等因素对空间扩散的影响,研究结果对于明确重点监测方向、指导MERS防控具有重要科学意义。
3.从多水平多要素全面探索MERS的时空分布及流行特征。研究结合病原数据及相关的生物、环境、社会学要素,形成个体、群体和分子水平三个现有MERS最新的数据库,关注重要因素间的交互作用,完善了目前对MERS流行病学特征的认识,明确了高危人群与高风险地区,为不同区域制定针对性的预防控制措施提供参考。