基于网络特征结构的超链路预测研究

来源 :杭州师范大学 | 被引量 : 0次 | 上传用户:leolee4510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
超网络是复杂系统结构的一种重要表示方法,其中的超边是一组任意多个节点集合,表示这组节点之间存在交互关系,如微信中的群聊天、化学上的多物质反应。超网络对成组关系的无失真表达很大程度上改变了人们对真实数据的建模方式。超链路预测问题,即对超网络上的潜在超边进行预测,是超网络研究的一个热点方向,也是理解超网络形成机制和演化规律的基础,具有很强的理论意义和应用价值。超网络复杂的拓扑结构和超边中节点个数的任意性使得超链路预测问题极具挑战,现有的超链路预测方法在预测效果、可解释性上都表现得不甚理想。为此,本文从探索超边的形成规律入手,基于网络结构特征分析进而开发出新的超链路预测算法,提升预测精度。其主要研究工作和贡献如下:(1)方法扩展研究。研究首先着眼于普通图的链路预测方法,将普通图内计算节点对相关性的方法扩展到超网络环境下,之后,由于超边大小的任意性,我们将上述方法再度进行扩展,使其能计算任意大小节点组的相关性。扩展的每一步简洁但不简单,具有很好的可解释性。在这一研究中,本文的杰出贡献是将一个基于带重启随机游走的方法扩展至超网络环境下,为此,我们首先引入了超网络上的随机游走,并基于该随机游走得到了平稳分布,研究证明了平稳分布的存在性,并最终得到了带重启随机游走的方法分数。(2)方法抽样分数研究。对上述所扩展方法在九个所引入的真实超网络中进行分数抽样,生成对应的分数抽样分布和误差棒图,基于所得到的统计特征对超网络进行结构分析并进行假设检验以验证扩展方法的有效性。这一研究显示不同类型的超网络方法分数统计特征有着明显差异,我们对这种差异进行了基于超网络结构的解释,并在最后验证了所引入的扩展方式的有效性。本研究还对不同大小超边的抽样分数分布进行了同样的结构性与有效性分析,并指出了不同大小的超边可预测性之间的差异。(3)超链路预测研究。本研究对所有以扩展方法在真实超网络上进行了标准的超链路预测实验,为克服负样本过多导致的极端类不平衡问题,本研究在实施的过程中对超边进行了依超边大小分布的下采样,从而平衡正负样本的数量。并以二分类的通用评价指标AUC、AUPR、精确率、召回率评估最后的链路预测结果。评估结果从一方面展示了所引入的随机游走方法的优越性,也从另一方面体现了超链路预测任务的困难性。类似于对方法分数抽样分布的研究,我们也评估了方法对不同大小的超边的预测性能,并得到了与上一研究类似的结论。这均佐证了大超边在形成前内部成员的强烈相关性。最后,我们引入了最近十分火热的集成学习技术:将前面所引入的各超链路预测方法看作特征,送入Light GBM、LR等机器学习模型用作集成学习,最后发现集成学习的效果与负边下采样的方式密切相关。综上所述,本文针对超链路预测问题,设计了多个扩展方法,并在统计分析的基础上,根据实际背景与真实超网络设计了标准的超链路预测实验。实验表明了所设计方法的有效性,不同大小超边可预测性上的区别,真实超网络的结构性差异以及不同负边采样方式对超链路预测的监督学习模型的性能影响。
其他文献
随着数字技术的快速发展,各国之间的运输和协调成本进一步降低,信息分享成本大幅下降,国际贸易不再局限于传统货物贸易,以往某些商品的不可交易性发生改变,商品和服务能够捆绑在一起进行交易,大量数字贸易涌现,这一变化过程极大地影响了产业生产以及对外贸易方式。当前,我国经济正在由高速增长阶段转向高质量发展阶段,经济高质量发展的核心内容包含产业结构优化升级,产业结构优化能够使得要素资源从低端产业流入高端产业,
学位
虚拟电路实验可以呈现传统实验中不够直观的实验现象,帮助学生更好地理解电路中的抽象概念。如何在呈现直观实验现象的同时保持良好的交互体验感是实验学习中的关键问题之一。为了解决目前虚拟电路实验视触不一致、交互不自然、交互负载大等问题,本文提出了一种基于空间增强现实(Spatial Augmented Reality,SAR)的电路实验系统。它允许学生使用3D打印的物理实体直接与系统进行交互,使学生有真实
学位
近年来,虚拟现实、增强现实和多媒体等技术被广泛应用于辅助实验学习,以提高学生学习实验技能的兴趣和效率。然而,现有的实验学习辅助方法大多存在交互方式不自然、信息呈现不直观、提示引导不及时等问题。如何使实验学习辅助工具更加智能化、人性化,让学生以更加方便、自然和高效的交互方式获得具有针对性的学习辅助信息,已成为该领域的重点研究内容。本文以解决当前实验学习辅助方法存在的问题,帮助学生更好地学习实验知识和
学位
从主动脉夹层术后并发急性呼吸窘迫综合征的病因、护理措施以及临床实践效果等方面进行综述,指出目前护理领域尚未形成针对主动脉夹层术后并发急性呼吸窘迫综合征标准化的护理模式,未来应继续努力探寻高质量的护理模式。
期刊
<正>随着经济的发展,企业之间的竞争日趋激烈,企业所面临的风险呈现出复杂性和多样性的特点,企业只有实现对风险的有效管理,才能防范风险发生给企业带来的不利影响。但是很多企业的内部控制中还存在一定问题,可能使企业的经济效益受损甚至走向衰败。企业只有提高自身的内部控制水平才能保障企业健康发展。本文针对企业内部控制进行研究,论述了企业内部控制常见的问题,并重点探讨了企业内部控制的对策,希望借此研究帮助企业
期刊
智能对话系统是通过自然语言理解、对话管理、自然语言生成等深度学习技术,使机器理解人类语言并与人类进行有效沟通,进而根据对人类语言中的意图进行理解并执行相应任务或做出回答的系统。目前,智能对话系统的自然语言理解模型大多数基于有监督的分类模型来进行意图识别,需要使用标注大量的文本数据进行训练对话模型。但现实情况往往由于缺乏足够数据,无法使自然语言理解模型覆盖全部的样本情况,导致意图识别效果较低,模型泛
学位
在我国企业发展过程中,一直强调要对体制内容进行创新,通过加强内部控制管理工作,使企业得到活力,继而促进企业的快速发展。所以,只有做好企业内部控制体系建设工作,才能促进企业的全面发展。但在当前阶段,企业的内部控制体系建设工作在执行过程中存在很多问题,需要针对现有的内部控制工作执行情况加以分析,并提供有效的解决方案,为企业内部控制水平的提升提供借鉴。
期刊
信息在网络中的扩散是网络科学中非常重要的研究问题。生活中信息的扩散随处可见,比如社群中的谣言传播和控制,疾病在人群中的扩散,还有令人印象深刻的意大利电网断电事件。真实网络表现出异质性,不同节点具有截然不同的功能和特性。因此量化评估节点的重要性并发现关键节点非常重要,可帮助我们扼制流行病的爆发,预测受欢迎的科学书籍和文章等。关键节点识别越来越受到各个学科的关注,相关的研究也有很多。之前的研究多数是基
学位
随着网络技术的飞速发展,信息日渐变得系统化和网络化。用户想在繁杂的数据网络中快速定位重点信息具有一定的难度,且基于重要性节点的网络分析对于人们的生产生活具有重要意义,所以高效精确地评估节点重要性与基于重要性节点的网络分析成为学者们关注的焦点。本文首先对复杂网络中重要节点识别工作进行了新维度的探索,即基于单分网络与二分网络实现节点重要性指标融合。目前中心性指标算法及其变体在开发研究中应用广泛,也有众
学位
癌症是细胞在发育过程中因内在或外在因素而使其处于无限增殖状态的一种病变,现在已经成为危害全人类健康的主要杀手之一。合成致死作为一种选择性杀死癌细胞的新型靶向策略,为癌症的精准治疗带来了曙光。合成致死描述的是两个基因同时丧失其正常功能(因基因突变或其他因素)时会对癌细胞的生长产生致命作用,但是它们分别丧失功能却不会产生对细胞生长造成影响的生物学现象。因此,如果一个基因与另一个经常发生肿瘤特异性突变的
学位