多层时效网络建模与重要节点识别方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:xiaoxie20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络重要节点识别是网络科学中重要的研究内容之一,揭示网络中的重要节点对于理解网络的结构与行为有着重要的理论和现实意义。其中,重要节点是指相比复杂网络中其它节点而言,能够对网络的拓扑结构和功能产生更大影响的一些特殊节点。随着科技的进步,现实世界中的各个系统不再是单一、孤立的了,而是广泛存在相互联系、相互依存的关系,同时系统的结构随时间动态变化。对于这种具有多层交互(多层性)和动态时变(时序性)特性的复杂网络系统,传统的网络模型已不能对其进行合理有效的描述。为了克服传统网络模型的缺陷,学者们提出了多层时效网络来描述复杂网络系统中的多层和时效特征。特别地,一些实际复杂网络系统可能仅含有多层性或时效性,此时多层时效网络将退化为多层网络或时效网络。因此,多层和时效网络可以看成是两类特殊的多层时效网络。围绕多层、时效以及多层时效网络的研究被认为是复杂网络领域的第二次革命,也被列为“复杂网络科学十大问题”之一。此外,准确识别复杂网络中重要的节点,对于致病基因的发现、抑制疾病的传播以及精准投放广告等具有重要的意义。本文主要针对多层、时效和多层时效网络建模以及重要节点识别问题展开研究,并将节点的重要性应用于时效网络链路预测问题。具体而言,本文主要研究内容如下:1.针对多层网络的节点重要性评估问题,提出了基于拓扑带偏随机游走的中心性。首先建立了一个不同层网络之间存在连边的多层网络模型来刻画多层网络的多层性,即网络中不同层网络之间存在相互联系、相互依存的关系,同时多层网络模型的基本结构由四阶张量表示。然后,通过将拓扑带偏随机游走引入到多层网络,构造了两个转移概率张量。基于构造的转移概率张量,建立一个张量方程组来定义多层网络中节点和层的中心性向量。进一步,为了得到节点和层的中心性向量,提出了类似于高阶幂法的不动点算法来求解所建立的张量方程组。在一定条件下,通过利用Brouwer不动点定理证明了张量方程组解的存在性、唯一性以及迭代算法的收敛性。最后,在一个合成和两个真实的多层网络上进行仿真实验,实验结果表明所提中心性能较好地识别多层网络中传播能力较强的节点。2.针对时效网络的节点重要性计算问题,提出了一种名为f-Page Rank中心性,该中心性可以看成是单层网络中Page Rank在时效网络上的推广。首先建立一个基于多层图的时效网络模型来描述时效网络,该网络模型考虑了不同快照(或称为时间层)之间的相互作用,并且不同快照之间的相互作用满足时间的不可逆性,即未来时刻的快照不能对历史时刻的快照产生影响。此外,时效网络模型的基本结构可通过采用四阶张量来表示。基于时效网络的张量表示,建立了带参数的张量方程组定义时效网络中节点和快照的中心性向量。在合适的条件下,从理论上给出了f-Page Rank中心性的存在性和唯一性定理。进一步,为了得到张量方程组的解,提出了一种求解张量方程组的不动点迭代算法,并给出了迭代算法的收敛性和收敛速度分析。最后,在一个合成和两个真实的时效网络(Email-Eu-Core和College Msg)上的实验结果表明f-Page Rank中心性能合理有效的度量节点和时间层的重要性。3.针对多层时效网络的节点重要性计算问题,提出了基于层间相似性的MTHITS(Multilayer temporal HITS)中心性,该中心性定义了节点的权威(Authority)和枢纽(Hub)中心性向量。首先,在多层、时效网络模型的基础上,建立了一个新的多层时效网络模型。在所建立的网络模型中,除了考虑每个快照内不同层网络间的相互作用,还考虑了不同快照间的相互作用关系,并且不同快照间的相互作用应满足时间的不可逆性。此外,通过采用六阶张量来表示多层时效网络模型的基本结构。基于网络的六阶张量表示,通过建立一个带参数的张量方程组将单层网络中的HITS中心性推广到多层时效网络上,张量方程组的解定义多层时效网络中节点、层和快照(时间戳)的枢纽和权威中心性向量。在合适的条件下,给出了张量方程组解的存在性和唯一性定理。进一步,为了得到张量方程组的解,提出了一种求解张量方程组的不动点迭代算法,并给出了迭代算法的收敛性和收敛速度分析。最后,实验结果验证了MT-HITS中心性具有较强的重要节点分辨能力。4.研究节点重要性在时效链路预测上的应用,提出了基于Page Rank和图正则化非负矩阵分解的时效链路预测方法,简称为GNMFCA(Graph regularized nonnegative matrix factorization based on centrality and asymmetric link)。GNMFCA分别利用图正则化和Page Rank中心性来保存时效网络中每个快照的局部和全局信息。然后,将时效网络的全局和局部信息融合到非负矩阵分解模型中,从而建立一个能同时保留网络局部和全局信息的优化模型。进一步,为了得到优化模型的最优解,提出了一种有效的拉格朗日乘子法来求解该模型,并对所提迭代算法进行了相应的理论分析。最后,在四个真实的时效网络上进行仿真实验,实验结果表明本章所提预测算法的预测精度高于一些已有的预测算法。
其他文献
近年来,支持向量机已经成为解决模式分类与回归问题的一种强有力的方法。经典的“最大间隔”支持向量机通过最大化两个不相交的半平面之间的距离来减低泛化误差。基于支持向量机理论,双平面支持向量机作为一种新的机器学习方法得到了广泛的研究。与经典支持向量机中的单个分类超平面不同,双平面支持向量机旨在生成两个非平行的超平面,其中,每一个超平面更接近于两类样本中的一类,并且尽可能地远离另一类。在求解过程中,双平面
学位
在大数据时代,海量数据的涌现促进计算机视觉、机器学习和模式识别的蓬勃发展,但也带来了处理高维数据问题的挑战。作为处理高维数据这一问题的典型方法之一,子空间聚类受到越来越多的关注。子空间聚类旨在发现高维数据中的低维结构。一般来说,原始数据通常会受到污染,数据一般具有非线性的结构,并且数据的样本量也非常庞大。若不能针对上述存在的现实问题去建立子空间聚类模型,将不利于随后的聚类任务。本文围绕原始数据中存
学位
学位
目的 检索、筛选、总结并分析系统性红斑狼疮(systemic lupus erythematosus,SLE)患者生育期保健的相关证据并形成最佳证据总结,为SLE患者生育期的护理及管理提供循证依据。方法 系统检索美国指南网、英国国家卫生和临床优化研究所网站、UpToDate、PubMed、Web of Science、Cochrane Library、BMJ Best Practice、澳大利亚乔
期刊
大数据时代,数据收集手段不断革新,数据存储能力不断提升,在气象学、生物化学、神经影像学等领域中涌现出大量以曲线形式存在的函数型数据.函数型数据是时间、空间等维度上的连续函数,这给传统的统计分析和数值计算带来了巨大的挑战.但是,其具有的无穷维数据特征能够蕴含更加丰富的数据信息,为发展新的统计理论以及拓宽实际应用领域提供了良好的机遇.因此,函数型数据分析已经成为当前统计学研究领域的热点和前沿问题之一.
学位
学位
学位
图互联系统是一类用无向图表征子系统拓扑关系的大规模系统,它利用集合来刻画子系统间互联信号的特性,是对实际工程中许多大系统动态变化的数学表达.针对大规模系统的特点,如子系统数量多、空间分布广,现代控制与通信技术多采用基于采样数据的数字装置与数字共享网络作为信号处理与传递的载体.将这些技术引入到图互联系统中,可以提高图互联系统设计的灵活性和维护的便利性,但现有的针对纯连续时间或纯离散时间图互联系统的分
学位
学位
电子设备集成度越来越高,功率不断增大,导致热流密度急剧升高,散热问题已经成为限制电子设备发展的技术瓶颈之一。喷雾冷却和微通道冷却利用了冷却工质的相变潜热,具有传热系数高、温度均匀性好、工质需求小等优点,常被用于解决高功率器件散热问题。然而,喷雾冷却和微通道冷却的影响因素众多,传热机理也极为复杂。为满足不同类型高热流密度电子设备的散热需求,需进一步探究喷雾冷却和微通道的强化换热方法。本文对喷雾冷却和
学位