【摘 要】
:
网络表示学习在网络处理相关领域发挥着越来越重要的作用。由于基础的表示学习已经不能满足不断扩大的网络规模对计算性能的需求,一系列处理大规模网络的模型被提出。这些方法将网络划分成为小的子图,再分别对子图中的节点进行处理,减少了算法的开销。但这些方法获取的子图过于碎片化,导致了一部分网络结构信息与节点的高阶邻居信息的损失,不仅忽略了不同子图在整体网络中位置信息的差异性,也没有考虑到网络中的节点可能同时属
论文部分内容阅读
网络表示学习在网络处理相关领域发挥着越来越重要的作用。由于基础的表示学习已经不能满足不断扩大的网络规模对计算性能的需求,一系列处理大规模网络的模型被提出。这些方法将网络划分成为小的子图,再分别对子图中的节点进行处理,减少了算法的开销。但这些方法获取的子图过于碎片化,导致了一部分网络结构信息与节点的高阶邻居信息的损失,不仅忽略了不同子图在整体网络中位置信息的差异性,也没有考虑到网络中的节点可能同时属于多个社区的网络性质。因此,新的网络表示学习模型成为国内外众多学者关注的研究热点。针对以上问题,提出了一种新的基于重叠子图的大规模网络表示学习模型,称为重叠社区图神经网络模型。重叠社区图神经网络模型可以在利用子图的优势处理网络的同时,利用重叠的社区划分尽可能地保留网络中子图之间的拓扑结构信息以及节点的高阶邻居信息,充分考虑了实际网络中的节点归属于多社区的情况。同时,该模型还通过分别学习节点的全局信息与局部信息的方式,获取了网络中不同子图的位置信息,体现了子图对于整体网络的独特的“角色性”。通过在多种任务下的实验验证,与现有的基于子图的网络表示学习模型相比,重叠社区图神经网络模型具有更好的性能。在多个大规模的数据集下的节点分类任务中,重叠社区图神经网络模型得到的表示可以让分类的micro-F1最多提高2.2%,而在链接预测任务中,相应的性能指标最高可提升7.4%。同时,实验也证明了重叠社区图神经网络模型的有效性。
其他文献
社区搜索作为图挖掘的重要研究内容,能被运用到社交网络推荐、语义扩展和流行病学调查等诸多应用当中。目前的社区搜索研究主要是在静态图上进行的,无法处理现实中广泛存在的时序信息。同时,现有的研究没有对顶点在不同社区中的参与情况进行区分,而一个顶点在各个社区中的参与情况通常存在着差异,其参与更多的社区对该顶点更为重要。因此,寻找到特定顶点参与最多的社区具有重要的意义。基于上述问题,对时序图中顶点重要参与社
间隔理论的相关工作表明,相比于最大化样本的最小间隔,优化间隔分布可以带来更好的泛化性能。最优间隔分布学习机正是基于这样的间隔理论提出的全新统计机器学习框架,并在大量机器学习任务中展示出了极佳的通用性和极好的泛化能力。然而,由于需要引入非线性核函数以解决线性不可分问题,其计算核矩阵的时间复杂度和空间复杂度都与样本数量相关,因此在训练数据集较大的情况下,训练最优间隔分布学习机所需的计算和存储资源都是难
数据作为当代互联的智慧城市生活中的一项关键资产,越来越多机构通过共享数据来推进科技发展。但由于数据本身敏感性,在共享的同时必须考虑到数据隐私保护的问题。在利用属性权限共享数据的过程中隐私问题可以被大致分为数据隐私、属性隐私和权限策略隐私三类。现有的方案主要基于区块链、密码学等技术实现数据共享,但都侧重于数据共享过程的访问控制与记录审计,仅保护了用户的数据隐私,忽略了属性和权限策略隐私。因此如何在数
随着需要存储的数据类型不断增多,管理海量非结构化数据的需求不断增加,受限于磁盘的工艺和架构,文档数据库已无法满足数据处理对于及时响应的要求。新型持久内存(Persistent Memory,PM)由于同时具有非易失特性以及近似于动态随机存储器(Dynamic Random Access Memory,DRAM)的快速的读取速度,为提升文档数据库的性能提供了新机会。但直接将传统的面向磁盘设计的文档数
CPU作为计算机系统的核心,其安全属性对于系统安全起到至关重要的作用。近年来公布的两组CPU安全漏洞Spectre与Meltdown,几乎影响了全球所有现代处理器,对计算机系统安全造成了严重的危害。其中,Spectre利用了现代处理器中广泛使用的推测执行技术,是一种难以防御的CPU安全漏洞。Spectre攻击误导受害者的指令流在错误的路径上执行,并且构建推测性侧信道来泄露受害者的秘密数据。最近针对
服务计算用于解决设备功能单一、算力弱及存储容量小等问题,通过服务发现方法引入第三方云服务来提升设备的能力,进而实现对数据的分析与存储任务。然而传统的服务发现算法需要依赖人工制定规则或者需要大量历史记录,并且随着应用开发复杂性增加以及服务数量的爆炸式增长,服务发现方法面临新的挑战:(1)服务描述存在歧义:不同公司提供的相同服务存在描述歧义;(2)服务描述格式异构:不同公司的服务描述格式不统一;(3)
随着计算和通信技术的发展,越来越多的智能车辆正在出现。基于车对车(Vehicle to Vehicle,V2V)网络的移动边缘计算(Mobile Edge Computing,MEC)技术可以为在车辆之间共享电力和资源提供一个可行的环境,并分担计算密集型边缘计算卸载任务。然而由于道路交通条件和车辆机动性的不可预测变化,在基于V2V网络的不稳定MEC环境中部署边缘计算卸载任务成为一个挑战。这种计算卸
近年来,智能家居作为物联网(Internet of Things,Io T)中极为重要的一个领域,在现代生活中占据着越来越重要的地位。与此同时,为了帮助用户更好地利用智能设备,新兴的物联网云平台为用户和开发人员提供了基于触发-响应(trigger-action)模式的编程框架,使得用户能够自定义各种各样的物联网应用,实现对物联网设备的自动化控制。然而,研究表明trigger-action模式下物联
实体抽取技术是从自然语言文本中获取关键信息的重要方法,是知识图谱构建、智能问答等下游任务的基础工作,然而仿生领域数据资源匮乏和仿生实体形式多样、中英混杂、多类型实体嵌套、相关学科众多等特性限制了通用实体抽取模型在仿生实体抽取任务上的精确率和召回率。针对上述问题,研究面向仿生领域的实体抽取方法,主要工作包括:(1)设计了仿生领域多源实体抽取系统,进行了实体类型定义、领域数据采集、半结构化数据抽取、领
近年来,图卷积网络受到了广泛的关注,并在社区检测、推荐系统等应用中表现出良好的效果和可解释性。然而,在目前的研究阶段,实现高效低延迟的图卷积网络推理计算仍是一个巨大的挑战。图结构数据本身的复杂性,使得图卷积网络在推理计算过程中呈现出了稀疏、不规则等特点。为此,学术界和工业界相继提出了一些专用的图卷积网络加速器,分别在计算和内存访问上进行了定制化的优化,并提供了比通用处理器更好的性能。然而,在处理大