中东呼吸综合征分布预测及其病原的系统发育地理学研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:gj12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景
  中东呼吸综合征(MERS)是由一种高致病性冠状病毒感染引起的呼吸道传染病,2012年9月在沙特阿拉伯首次被发现。该病病死率高、症状不易辨别且缺乏有效的药物治疗和预防策略,现已从主要流行的中东地区逐渐蔓延至四大洲27个国家,具有全球流行的潜在趋势,引起世界各国的极大关注,成为全球公共卫生领域研究难点和热点。2018年2月,世界卫生组织(WHO)决定将MERS纳入WHO研究与发展蓝图计划,以着力推进该领域研究进展。自MERS出现已有八年,目前在流行病学、病原学、诊断防治等方面开展的研究较多并取得一定成果,但在研究内容上多侧重单独研究其流行病学特征或病原学进化动态,研究设计上缺乏对社会经济、气象地理等多种要素时空分布的有效利用,未能综合考虑时空分布异质性等特征,此外欠缺对MERS时空扩散及洲际范围疫源地风险的预测评估。本研究基于最新数据,综合考虑生物、环境、社会学因素的影响,融合空间信息技术、机器学习模型和系统发育地理学分析技术,从个体、群体和分子层面全面开展对MERS的传播动态、风险评估及其病原系统发育地理学研究,研究结果有助于完善目前对MERS流行病学特征的认识,探索疾病早期扩散的促进因子,识别高风险区域和脆弱人群,为不同区域制定针对性的干预策略与措施提供科学指导,为探索MERS传播机制、实验室检测和疫苗研究提供方向,具有重要的公共卫生学意义。
  研究目的
  1.描述全球MERS的三间分布特征及地理分区,重点比较接触动物感染和接触病人感染的病例特征差异。
  2.探讨个体层面影响MERS死亡的危险因素及交互作用,并结合区域环境要素探索群体层面影响MERS扩散的危险因素。
  3.结合自然因素和社会因素,采用多种机器学习模型量化MERS-CoV疫源地的分布及发病风险,探索主要贡献因子并绘制风险地图。
  4.利用系统发育地理学分析技术完成MERS-CoV的进化家系、时空迁移分析和进化压力位点分析,并将家系信息纳入个体群体层面,进一步探索家系进化对MERS流行特征的影响。
  研究方法
  1.数据收集收集全球2020年6月1日前所有MERS个案病例,主要来源于世界卫生组织官方报告,并通过联合国粮食及农业组织网站、受影响国家的卫生部门网站和公开发表的论文完成病例信息检索及补充,形成MERS个案流调数据库。同期动物样本阳性检测数据来源于联合国粮食及农业组织及文献检索。人口数据、骆驼密度数据、气象数据、土地利用数据、海拔数据、交通数据等均来源于相应领域官方网站或数据库。所有数据都遵循数据质控要求完成原始数据的清洗、整理和提取加工,形成区域多要素数据库。检索GenBank数据库中2020年6月1日前发布的MERS-CoV的全基因组序列(>30,000bp)及对应蛋白序列,经过采样地区和采样时间的核实确认,形成MERS-CoV分子序列数据库。
  2.统计分析
  (1)描述全球MERS病例的时空分布和流行特征分区,明确不同感染方式(接触动物感染和接触病人感染)病例的人口学特征和疾病特征差异。
  (2)基于logistic回归模型探索与MERS病例结局相关的危险因素,多因素回归分析时考虑重要变量(年龄组、性别和动物接触史)之间的二元交互作用,结果呈现时分别给出其他变量不同等级时对应的效应值。
  (3)基于Cox比例风险回归模型,结合人口学信息、生物环境和社会经济因素,对MERS病例在中东地区的时空扩散特征进行评估并探索危险因素。为了直观展示人类病例的时空扩散情况,借助ArcGIS中趋势表面分析模块,以等值线形式绘制中东地区MERS传播的空间趋势图。
  (4)结合人口学信息、生物环境和社会经济因素,采用多种机器学习模型对研究范围内MERS-CoV的生态适宜度进行估算。首先按照传统策略,使用增强回归树模型、随机森林模型和支持向量机模型三个基础模型,通过后续模型结果评估比较选择最优模型。其次采用集成学习的策略,使用堆叠方法将上述三种模型做集成学习,以获得比单一模型更优越的泛化性能。基于集成学习模型结果识别出高风险区域,绘制MERS-CoV自然疫源地分布预测图;基于最优基础模型提取重要贡献因子,并运用logistic回归获得重要特征变量的确切效应值。
  (5)使用Nextstrain框架进行系统发育分析,研究MERS-CoV的遗传多样性和进化历程,通过系统发育地理学分析明确重要MERS-CoV家系的时空分布特征及迁徙模式。使用PAML软件包用最大似然法对蛋白质基因编码序列进行正选择位点分析。应用统计学匹配抽样方法将分子水平的家系信息与群体和个体发病状况相关联,探讨MERS-CoV的致病性是否随遗传进化或家系转变而变化。
  3.使用软件数据分析使用ArcGIS10.5、R3.6.2、Python2.7、Nextstrain、MAFFTv7.407、IQ-Treev1.6.10、PAL2NALv14、PAMLv4.9、CorelDRAWX8等软件和编程环境。
  研究结果
  1.建立了包含2450例MERS病例的个案病例数据库(包括150个病例集群)。其中,802例患者死亡,病死率为32.73%,69.35%的病例为男性,发病年龄中位数为53岁(四分位数间距为38-65岁),医护人员占病例总数的13.67%。在1453名接触史信息明确的患者中,356名(24.04%)报告有动物接触史。空间分布上MERS病例主要分布于热带地区和北半球,发病数最高的地区为中东地区,以沙特阿拉伯最高,其次为韩国。结合传播模式分类,发现存在接触本地动物感染病例的国家均分布于阿拉伯半岛,虽然欧洲和东南亚地区也报告了具有动物接触史的病例,但均属于输入病例。时间分布上,2014-2015年包含了3次发病高峰,主要源于沙特阿拉伯和韩国的暴发疫情,季节性分布上发现春季(4-6月)存在发病高峰。接触动物感染和接触病人感染两种传播方式产生的病例在人口学特征和疾病特征上存在显著差异,与没有动物接触史的病例相比,接触动物感染的病例病死率更高,男性患者数量更多,年龄更大,患有基础疾病比例更高,从疾病发作到诊断的时间更长,上述特征的差异都具有统计学意义(P<0.001)。而医务人员及无症状患者的感染方式基本是接触病人感染。此外两种传播模式的季节性也不同,接触动物感染病例主要出现在在1-3月,而接触病人感染病例发病高峰紧随其后。
  2.死亡危险因素分析显示,年龄≥65岁、男性、中东居民、患有基础疾病以及发病前具有明确动物接触史的病例死亡风险较高。同时年龄、性别和动物接触史间均存在具有统计学意义的双变量负向交互作用,在没有动物接触史和女性病例中,年龄的危险效应更为明显;研究发现死亡风险对动物接触史的依赖性随年龄和性别而变化,动物接触史是<65岁女性患者死亡的独立危险因素。
  3.时空扩散趋势分析显示,MERS在2014年4月至2015年底之间自阿拉伯半岛中部迅速传播到周围地区,其中由发源地向阿拉伯联合酋长国和阿曼方向扩散速度最快。公路和铁路交通网络在MERS早期陆路区域内的快速扩散中发挥了重要作用。除交通因素外,海拔、荒地覆盖面积占比和医院数量也是MERS扩散的危险因素。
  4.研究中应用的四种机器学习模型在预测MERS-CoV自然疫源地分布上效果均良好,模型应用测试集测试时AUC最低为84.14%,以集成模型效果最优(AUC=91.66%)。以集成模型对整个研究范围做MERS-CoV疫源地风险预测,绘制的风险地图显示自然疫源地主要分布在热带,高风险和中度风险地区跨越中东、西亚、北非和东非小部分,远远大于目前报道的MERS病例或检测到阳性动物样本分布的地理范围;南欧、非洲中部和南部的风险较小,这与在这些地区仅观测到的少数输入性病例或阳性动物样本相符。敏感性分析中,基于仅用阳性数据建模预测的最大熵MaxEnt模型,发现其预测风险分布情况与上述模型基本一致,证明各模型结果合理可信。影响因子贡献度上,我们发现荒地覆盖面积占比是影响MERS-CoV疫源地分布的主要贡献因子,贡献度为30.06%,其次是林地覆盖面积占比(10.74%),人口密度、年平均温度、耕地覆盖面积占比和骆驼密度均为中等贡献变量,贡献度范围为6.20-7.28%。因子反应曲线显示MERS-CoV疫源地分布与较高水平的荒地覆盖面积占比、人口密度、年平均温度和骆驼密度有关,也与较低的森林和农田覆盖面积占比有关。基于上述贡献因子做多因素Logistic回归分析,较高水平的荒地覆盖面积占比效应值最高(OR=23.74),其次为较高水平的年平均温度(OR=4.05)和骆驼密度(OR=1.80)。多因素分析中未纳入森林和耕地覆盖面积占比,由于二者与荒地覆盖面积占比的相关性很高(R>0.6)。此外,多因素研究中未发现荒地覆盖占比、人口密度、年平均温度和骆驼密度之间存在显著的双变量交互作用。
  5.系统发育分析表明,人类、骆驼(含羊驼)中检测到的病毒序列形成了主要进化枝,而蝙蝠和刺猬来源的病毒序列形成了与之距离较远的进化枝,表明骆驼是MERS动物宿主。在人与骆驼序列构成的主进化枝中,人类和骆驼的序列在整棵树中混合交叉在一起,这提示从骆驼到人类存在多次引入事件。主进化枝包含编号为C1-C5的五个亚进化枝,其根节点可以追溯到2007年1月,根节点来源骆驼的可能性为49.3%,来源人类的可能性为50.7%。系统发育地理学分析上,主进化枝的时空传播特征主要表现为中东地区内部强烈的局部迁移和偶尔出现的远距离迁移;推断起源地最可能出现的三个位置是沙特阿拉伯的利雅得、尼罗河三角洲地区和约旦,其后验概率分别为31%,17%和12%。利雅得是当地和国际输出感染的主要来源,它是亚进化枝C3、C4和C5(覆盖了所收集序列的97.5%)的共同祖先节点位置的后验概率具有99%。根据序列空间迁移图谱,2011-2012年该病毒从利雅得向沙特阿拉伯其他城市、阿拉伯联合酋长国的阿布扎比和欧洲部分城市迁移,阿布扎比很快加入利雅得,成为第二个病毒输出枢纽;2013-2015年病毒传播最为迅速,自中东输出到北美、非洲和东亚,与实际中2014年中东向美国以及2015中东向韩国的输出事件相符合。位点分析上,研究确定了刺突糖蛋白中可能与正向选择相关的八个氨基酸位置,其中三个是现有认知的新发现位点。将平滑后的地区发病率等指标与人类序列关联后,发现系统进化树中各家系对应病例病死率不同,C5的病死率高于其他进化枝。但将家系信息匹配至个体层面进行死因分析时,家系特征对死亡的作用无统计学意义。
  研究结论
  1.MERS具有明确动物接触史的病例比例持续上升,且与人传人病例相比,动物传人病例的病死率更高,加强动物中该疾病的监测、防控和治疗应是今后MERS研究的重点,同时加强动物传人病例监测等。
  2.MERS病死率较高,其死亡的高风险人群为老年人、男性、中东居民和患有基础疾病的病例,死亡风险对动物接触史的依赖性随年龄和性别而变化,提示应对高危人群加强监测与宣教以预防感染,一旦确诊应及早采取救治措施。
  3.交通网络在MERS早期陆路区域内的快速扩散中发挥了重要作用,在与MERS高风险区域交通便利或交流频繁的地区,应在重要交通枢纽中持续加强对MERS的监测与防控。
  4.基于机器学习模型进行的疫源地风险预测提示高中风险区包含中东、西亚、北非和部分东非,远远大于现有病例报告的地理范围,未来应加强对应区域的病例监测与干预措施。
  5.序列分析发现骆驼是动物宿主,进化中存在骆驼到人类的多次引入事件,检测试剂应该增强对目前占主导的C5家系的识别,刺突糖蛋白中识别到三个现有认知新发现的正向选择位点,可为进一步定位疫苗的潜在靶点和开发MERS-CoV的抗病毒药物提供研究方向。
  创新性
  1.开展了跨洲际多要素细尺度MERS-CoV疫源地风险评估研究。在对应研究中,我们不仅构建模型预测了动物宿主骆驼的空间分布,而且将接触本地动物感染患者、感染的宿主动物的分布同时纳入模型作为结局变量,以获得更可靠的MERS-CoV适宜生境分布图。我们创新性地采用堆叠方法将多种基础机器学习模型进行集成学习,得到了最优效果的预测模型,大大提高了自然疫源地预测的精度和准确性。目前上述研究在现有公开文献中尚无报道。
  2.开展了MERS-CoV空间扩散动态及其影响因素的研究。采用空间趋势面分析、系统发育地理学等多学科交叉的研究方法,从报告病例和病原核酸序列两个方面相互验证,共同揭示了MERS-CoV的空间扩散特征,并定量估算了交通、医院分布等因素对空间扩散的影响,研究结果对于明确重点监测方向、指导MERS防控具有重要科学意义。
  3.从多水平多要素全面探索MERS的时空分布及流行特征。研究结合病原数据及相关的生物、环境、社会学要素,形成个体、群体和分子水平三个现有MERS最新的数据库,关注重要因素间的交互作用,完善了目前对MERS流行病学特征的认识,明确了高危人群与高风险地区,为不同区域制定针对性的预防控制措施提供参考。
其他文献
学位
1.研究背景他汀类药物(3-羟基-3-甲基戊二酰辅酶A还原酶抑制剂)较广泛地应用于临床,特别是心血管疾病领域,早已成为心血管疾病一级预防和二级预防的基石。他汀类药物具有良好的降脂作用,不仅能够较强地降低总胆固醇(TC)、低密度脂蛋白胆固醇(LDL-C),较弱地降低甘油三酯(TG),还能够升高高密度脂蛋白胆固醇(HDL-C),除此之外还有抗炎、保护内皮、抑制血栓、抗动脉粥样硬化、稳定斑块等作用,可以
学位
学位
研究背景  急性淋巴细胞白血病(Acute lymphoblastic leukemia,ALL)是最为常见的具有侵袭性的血液恶性肿瘤。近年来随着ALL疾病诊断技术与方法的提高、联合化疗方案的完善、不良反应防治手段及治疗的进步,低中危ALL患者的生存率得到了大幅度提高。随着ALL患者治疗疗效的改善及生存期的延长,科学研究的重心转向了用药安全性和有效性、疾病对患者的长期影响以及疾病的并发症。合理的药
学位
研究背景  抑郁症(Depression)是一种常见并且严重的神经障碍类疾病,临床表现为持续的情绪低落、思维迟缓和生活无意义感。而重症抑郁症患者甚至会产生自杀的倾向,严重危害人类健康。目前抑郁症的治疗主要以药物缓解为主,已有的抗抑郁药物(选择性5-羟色胺(5-hydroxytryptamine,5-HT)再摄取抑制剂、5-羟色胺-去甲肾上腺素(noradrenaline,NE)再摄取抑制剂)主要通
学位
抗生素使用与细菌耐药性增长的问题已成为21世纪人类在医药健康领域亟待解决的问题之一。于20世纪60年代初期合成并投入临床应用的甲氧苄啶(TMP),作为细菌二氢叶酸还原酶(DHFR)的竞争性抑制剂,通过阻止二氢叶酸还原为四氢叶酸,干扰细菌叶酸代谢达到抑制细菌生长的目的。四氢叶酸是细菌体内重要的一碳单位,参与DNA、RNA和某些氨基酸的合成。因为细菌不能利用体外四氢叶酸,二氢叶酸还原酶的还原是四氢叶酸
学位
背景:结核性脑膜炎(Tuberculous meningitis,TBM)是由结核分枝杆菌(Mycobacterium tuberculosis,MTB)引起的中枢神经系统感染性疾病,表现为结核性炎症、脑水肿、脑积水等引发的脑膜刺激症和发热、头痛等结核中毒症状群,具有致死率和致残率高等特点。荟萃分析显示,TBM的死亡风险为24.7%,成人晚期艾滋病(HIV)患者中死亡率超过50%,幸存者神经系统后
学位
近年来,随着晶体管尺寸的不断缩小,摩尔定律已经接近极限,芯片集成密度增速也随之减缓,因此人们提出从器件集成化和系统功能多样化等方面来延续摩尔定律。其中,“探索更高迁移率的新沟道材料以及实现其全包栅结构纳米线场效应晶体管”是有效的解决方案之一。在高迁移率新沟道材料的探索过程中,Ⅲ-Ⅴ族纳米线材料受到了广泛关注,本论文聚焦高迁移率Ⅲ-Ⅴ族纳米线的可控合成与性能研究开展工作。  本论文首先对一维无机纳米
第一部分聚乙二醇干扰素α-2a治疗HBeAg阳性初治慢性乙型肝炎患者的个体化研究目的探讨聚乙二醇干扰素(Peg-IFN)α-2a个体化治疗HBeAg阳性初治慢性乙型肝炎(CHB)患者的临床疗效及相关预测因素。方法对139例HBeAg 阳性初治CHB患者给予Peg-IFNα-2a 180μg每周1次皮下注射48周,随访48周。治疗前留取2ml血标本分离后提取血浆上清液放置-20℃冰箱保存。所有患者均
学位
能源是推动人类社会进步和科技发展的源动力,长久以来人类社会已形成以煤炭、石油、天然气等化石能源为主的能源结构。而近年来,随着化石能源的不断消耗,一方面化石能源储量有限,有些化石能源即将消耗殆尽,另一方面化石能源的大量消耗造成二氧化碳等“温室气体”的大量排放,严重破坏着地球的生态环境。因此,为缓解目前全球能源短缺和生态环境恶化问题,继续保持和推进人类社会的不断进步和科技的创新发展,探索和寻找新型清洁
学位