论文部分内容阅读
近年来,越来越多的研究工作将机器学习方法应用于统计物理领域中伊辛(Ising)模型相变临界点的识别问题。复杂网络上的易感-感染-易感(Susceptible-Infected-Susceptible,SIS)流行病传播动力学与伊辛模型有诸多相似之处,比如每个节点都可能处于两个微观状态中的一个,动力学系统都具有两个相位,它们的相变类型都属于二级相变等。然而,目前将机器学习方法用于网络动力学的研究工作仍然比较少。一直以来,复杂网络上流行病爆发的阈值识别问题都是网络动力学研究中的热点课题之一。鉴于此,本文主要研究如何利用深度学习方法来解决该问题,分别基于前馈神经网络和卷积神经网络提出了两种SIS传播动力学的阈值识别模型。在不同合成网络和真实网络上的大量模拟实验表明,两种学习方法均可以比较准确地识别出复杂网络上SIS模型爆发的阈值。首先,本文提出了一种基于前馈神经网络的阈值识别模型。该模型可以通过监督学习或“模糊学习”两种方法对复杂网络上SIS模型的爆发阈值进行准确识别。基于监督学习的模型思路直接简单,运算速度快,并且在一些网络结构中取得了很好的效果。但是基于监督学习的阈值识别方法的鲁棒性不高,易受数据集对称性和标签准确性的影响。当训练集中两种相位的数据规模相差太多或无法得知准确的相变阈值作为训练集标签时,模型给出的阈值的准确性会下降。为了提升模型的学习稳定性,本文紧接着使用了一种融合了监督学习和非监督学习的方法:“模糊学习”,使得模型摆脱了对训练集中微观状态的相位信息的依赖。然而在某些异质网络中,由于大度节点的存在,导致动力学信息主要集中在这些中心节点上,而大量小度节点的存在将会干扰大度节点信息的影响力,令模型的学习效果的降低。鉴于此,本文针对性地提出了两种基于网络节点重要性的网络抽样方法,以此来强化重要节点上的信息。通过学习抽样后的网络数据,模型在许多不同结构的网络上都可以准确地识别出疾病爆发的阈值,并提升了学习的速度。其次,针对基于前馈神经网络的模型无法学习复杂网络的结构信息这一缺陷,本文提出了一种基于卷积神经网络的阈值识别模型。该方法可以同时学习网络的拓扑结构信息和微观动力学信息,无需利用网络抽样方法就能够获得准确的疾病爆发阈值。由于卷积神经网络更适合学习图片结构的数据,我们先通过网络表示学习方法将网络拓扑信息转换为二维图片,然后将网络中各节点的两种微观状态信息分别表示在两张独立的图片中,形成多通道图片。卷积神经网络学习这些带有动力学信息的多通道图片,并结合“模糊学习”方法识别出准确的阈值。在降维算法的选择上,为了避免降维后的图片出现“中心集聚”现象而影响学习效果,我们使用了双曲空间降维算法来消除这种影响。大量真实网络数据上的实验表明,在面对随机噪声、非对称的数据集和不准确的标签等不同情况时,基于卷积神经网络的模型的学习鲁棒性高,均可以准确识别出爆发阈值。本文提出的阈值识别模型是我们在复杂网络动力学与机器学习方法相结合方面的一次尝试。本文的主要工作为复杂网络中相关动力学问题的研究提供了新思路。