论文部分内容阅读
复杂网络作为一门新兴的交叉学科,吸引了来自物理、数学、生物和计算机等不同领域专家的共同兴趣。复杂网络理论已被运用到流行病、社会传播、交通流以及脑科学等多方面的研究中,其中关于流行病和社会传播的研究主要有两个目的:抑制爆发和加速消亡。在研究流行病和社会传播时,学者们常采用拓展原有模型的方法来探索新的现象。这种研究方法虽然合理,但不利于揭示出那些超出传统模型的特征,特别是对一些新的流行病或传统模型不能描述的情形,这个问题就更加突出。在本论文的研究中,我们采用完全相反的研究思路。在研究模型之前,我们首先收集并分析数据,从中发现待研究的课题。在流行病的研究中,学者们主要关注流行病的爆发过程,而忽视了流行病的结束阶段。其造成的后果之一是,在面对已经大爆发的新冠肺炎时,由于没有相应的理论支持,各国政府找不到有效的控制策略。考虑到社会传播和流行病的研究方法类似,我们在本论文中研究了社会网络上病毒和信息传播的动力学行为。通过分析流感和麻疹的数据,我们做了两个工作来揭示流行病传播的爆发过程和结束过程不对称的现象,并从迟滞回线的角度对其背后的物理机制进行了理论分析,解释了迟滞回线的面积在状态空间和参数空间中对于参数的依赖性存在的悖论现象。具体来说,通过分析流感和麻疹的数据,我们发现这类复发性流行病的传播过程可以分为爆发和结束过程,并且两个过程不对称,构成了迟滞回线。通过使系统在演化到稳态之前就绝热地改变感染率,我们成功地在参数和状态空间中再现了数据中的迟滞回线,发现感染率的含时变化以及系统演化的记忆效应是出现迟滞回线的原因。此外,我们还研究了迟滞回线的面积对于感染率增量和暂态演化时间长度的依赖性,并且发现迟滞回线的面积对于参数的依赖性在参数和状态空间中存在悖论。借鉴流行病传播理论,我们在第三个工作中提出了舆论传播中有效再生数的理论推导方法。该方法具有仅依赖新增参与话题讨论人数时间序列的特征,并运用微博数据进行验证。具体来说,通过分析微博平台上不同事件的转发数据,我们得到了相应的每日新增参与话题讨论人数的时间序列。我们发现不同事件的传播潜力不同,对应时间序列的形状也不同。我们常用有效再生数来判断流行病或消息的传播潜力,所以在本工作中,我们给出了推导有效再生数的方法。该方法仅依赖于每日新增参与话题讨论人数的时间序列。推导的核心如下:根据贝叶斯定理,每日新增参与话题讨论人数的时间序列服从泊松分布,该分布与生成时间的分布和有效再生数相关。通过使用Daley-Kendall模型来模拟消息的传播过程,并记录每个节点的全部传播信息,我们发现在舆论模型中生成时间的分布满足负二项式分布。在已知每日新增参与话题讨论的时间序列和生成时间的分布时,我们就可以使用Markov Chain Monte Carlo方法来计算有效再生数。基于新冠肺炎相关的采集数据,我们在第四个工作中研究了易感性对于新冠病毒传播的影响。具体来说,通过分析武汉和上海的新冠肺炎确诊病例数据,我们发现确诊病例中具有明显的年龄和性别异质性,并计算了不同年龄和性别的个体出现症状的概率。结合武汉和上海的民众在新冠爆发前后的接触矩阵,我们采用具有年龄和性别结构的SIR模型来研究易感性和接触矩阵的改变对于新冠肺炎传播的影响。我们的研究表明,新冠肺炎的传播存在年龄差异,老年人相较年轻人更容易被感染,这对制定更加有效的防疫措施有重要帮助。在本毕业论文中,我们从数据的角度探讨了流行病和社会传播的爆发和结束特征,为流行病和社会传播的研究提供了一种新思路,同时也开辟了一片新天地。流行病和社会传播的研究事业还远未到结束的时候,还有很多问题等着我们去发现和研究。