论文部分内容阅读
复杂网络重要节点识别是网络科学中重要的研究内容之一,揭示网络中的重要节点对于理解网络的结构与行为有着重要的理论和现实意义。其中,重要节点是指相比复杂网络中其它节点而言,能够对网络的拓扑结构和功能产生更大影响的一些特殊节点。随着科技的进步,现实世界中的各个系统不再是单一、孤立的了,而是广泛存在相互联系、相互依存的关系,同时系统的结构随时间动态变化。对于这种具有多层交互(多层性)和动态时变(时序性)特性的复杂网络系统,传统的网络模型已不能对其进行合理有效的描述。为了克服传统网络模型的缺陷,学者们提出了多层时效网络来描述复杂网络系统中的多层和时效特征。特别地,一些实际复杂网络系统可能仅含有多层性或时效性,此时多层时效网络将退化为多层网络或时效网络。因此,多层和时效网络可以看成是两类特殊的多层时效网络。围绕多层、时效以及多层时效网络的研究被认为是复杂网络领域的第二次革命,也被列为“复杂网络科学十大问题”之一。此外,准确识别复杂网络中重要的节点,对于致病基因的发现、抑制疾病的传播以及精准投放广告等具有重要的意义。本文主要针对多层、时效和多层时效网络建模以及重要节点识别问题展开研究,并将节点的重要性应用于时效网络链路预测问题。具体而言,本文主要研究内容如下:1.针对多层网络的节点重要性评估问题,提出了基于拓扑带偏随机游走的中心性。首先建立了一个不同层网络之间存在连边的多层网络模型来刻画多层网络的多层性,即网络中不同层网络之间存在相互联系、相互依存的关系,同时多层网络模型的基本结构由四阶张量表示。然后,通过将拓扑带偏随机游走引入到多层网络,构造了两个转移概率张量。基于构造的转移概率张量,建立一个张量方程组来定义多层网络中节点和层的中心性向量。进一步,为了得到节点和层的中心性向量,提出了类似于高阶幂法的不动点算法来求解所建立的张量方程组。在一定条件下,通过利用Brouwer不动点定理证明了张量方程组解的存在性、唯一性以及迭代算法的收敛性。最后,在一个合成和两个真实的多层网络上进行仿真实验,实验结果表明所提中心性能较好地识别多层网络中传播能力较强的节点。2.针对时效网络的节点重要性计算问题,提出了一种名为f-Page Rank中心性,该中心性可以看成是单层网络中Page Rank在时效网络上的推广。首先建立一个基于多层图的时效网络模型来描述时效网络,该网络模型考虑了不同快照(或称为时间层)之间的相互作用,并且不同快照之间的相互作用满足时间的不可逆性,即未来时刻的快照不能对历史时刻的快照产生影响。此外,时效网络模型的基本结构可通过采用四阶张量来表示。基于时效网络的张量表示,建立了带参数的张量方程组定义时效网络中节点和快照的中心性向量。在合适的条件下,从理论上给出了f-Page Rank中心性的存在性和唯一性定理。进一步,为了得到张量方程组的解,提出了一种求解张量方程组的不动点迭代算法,并给出了迭代算法的收敛性和收敛速度分析。最后,在一个合成和两个真实的时效网络(Email-Eu-Core和College Msg)上的实验结果表明f-Page Rank中心性能合理有效的度量节点和时间层的重要性。3.针对多层时效网络的节点重要性计算问题,提出了基于层间相似性的MTHITS(Multilayer temporal HITS)中心性,该中心性定义了节点的权威(Authority)和枢纽(Hub)中心性向量。首先,在多层、时效网络模型的基础上,建立了一个新的多层时效网络模型。在所建立的网络模型中,除了考虑每个快照内不同层网络间的相互作用,还考虑了不同快照间的相互作用关系,并且不同快照间的相互作用应满足时间的不可逆性。此外,通过采用六阶张量来表示多层时效网络模型的基本结构。基于网络的六阶张量表示,通过建立一个带参数的张量方程组将单层网络中的HITS中心性推广到多层时效网络上,张量方程组的解定义多层时效网络中节点、层和快照(时间戳)的枢纽和权威中心性向量。在合适的条件下,给出了张量方程组解的存在性和唯一性定理。进一步,为了得到张量方程组的解,提出了一种求解张量方程组的不动点迭代算法,并给出了迭代算法的收敛性和收敛速度分析。最后,实验结果验证了MT-HITS中心性具有较强的重要节点分辨能力。4.研究节点重要性在时效链路预测上的应用,提出了基于Page Rank和图正则化非负矩阵分解的时效链路预测方法,简称为GNMFCA(Graph regularized nonnegative matrix factorization based on centrality and asymmetric link)。GNMFCA分别利用图正则化和Page Rank中心性来保存时效网络中每个快照的局部和全局信息。然后,将时效网络的全局和局部信息融合到非负矩阵分解模型中,从而建立一个能同时保留网络局部和全局信息的优化模型。进一步,为了得到优化模型的最优解,提出了一种有效的拉格朗日乘子法来求解该模型,并对所提迭代算法进行了相应的理论分析。最后,在四个真实的时效网络上进行仿真实验,实验结果表明本章所提预测算法的预测精度高于一些已有的预测算法。