基于节点表示的属性网络中的链接预测技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:bobo1116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
链接预测是属性网络中常见的一类任务,即预测两个节点之间的边存在的可能性,核心在于构建有效的链接表示。传统的方法往往依靠费时费力的特征工程,但是近年来,表示学习和深度学习的发展为链接表示问题注入了新思想。大量实验表明,从节点表示出发进而构造更有力的链接表示,对于链接预测任务是一条更为便捷且高效的道路。  本文重点在于探讨属性网络上的链接预测问题,核心是如何得到更高效的节点表示。目前,在属性网络中,单属性节点的表示问题已经取得了很多进展,但是多属性节点尚没有得到足够的关注。  本文从一种学习单属性节点表示的主流方法-Node2vec算法出发,首先从原理上分析了它的局限性,然后通过多个链接预测实验论证了其具有浅层学习特征的特点。本文针对该方法的局限性,提出了使用神经网络再学习这一改进方法,多个数据集上的链接预测实验证明了其有效性。  进而本文提出了多属性节点的表示问题。思路是:首先把属性分为主要(感兴趣的)属性和辅助属性,然后针对每一种属性,都抽取出一个网络,再通过Node2vec学到一层浅层的节点表示,然后针对多个属性来源的节点表示,使用神经网络进行高层抽象和深度融合。这种基于Node2vec和神经网络融合多属性节点表示的思路,YouTube网络数据集上的实验多角度地验证了其有效性和可行性。  此外,针对链接预测任务以及Node2vec算法,本文提出了构造训练集和测试集的新方法。在Node2vec这种随机漫步方法中,本文认为常见的随机切分链接集合的做法是不合理的。本文通过对网络节点度的统计分析,提出针对不同度的节点提取不同比例的链接加入测试集的新方法,保证了采样过程对网络节点的全覆盖,尤其是处理多属性节点之间的链接的做法,具有一定的借鉴性。
其他文献
串联质谱(Tandem Mass Spectrometry)是蛋白质序列鉴定的重要方法,其目标是从实验质谱来推断未知肽段的氨基酸序列。在此过程中,如何从一个肽段序列精确地预测出对应的理论质谱
虚拟机就是由真实机器和软件所组成的一个虚拟环境,虚拟机及相关优化技术的研究,在遗产代码移植、硬件设计、程序性能提高、网络应用、系统安全等方面都有重要的意义,已经成为是
继续表示程序在某个执行状态下的剩余计算抽象。继续在计算机科学的各个分支中都有重要的应用。本文讨论继续在程序设计语言中的理论与应用。   继续传递风格(CPS)变换是
本文研究了计算复杂性中的几种归约方法,应用它们刻画了一些计数问题的计算复杂性,或者给出了多项式时间算法,或者证明其是#P完全的;研究了匹配线路和匹配门的性质。   多项式
随着Internet规模的扩大和网络应用的普及,网络安全问题日益突出。为了实现对敏感数据的保护,同时打破企业内部网的职能范围在物理位置上的限制,虚拟专用网(Virtual Private Net
中国的海岸线长度超过18000公里,频繁的遭受暴雨、雷暴等强对流天气的侵袭。这些自然灾害往往给社会和经济带来巨大的损失。中尺度对流系统(Mesoscale Convective System,MCS)
随着集群技术和网络技术的飞速发展,网络存储系统成为解决集群I/O性能瓶颈的主要手段之一。集群文件系统作为网络存储系统的核心技术,很好地解决了传统文件系统中存在的性能、
机群系统凭借其良好的易构建性和可扩展性,无论是在高性能科学计算领域,还是在商业计算领域,都得到了广泛的应用。但是随着机群系统硬件规模的不断扩大以及应用的复杂化,系统出现
在计算机技术发展过程中,模拟一直是一个十分重要的研究方法。模拟器是运行在一个平台上的特殊程序,它可以模拟另外一个平台所具有的特征,前者称为宿主机,后者称为目标机。模拟器
近几年来,多模移动终端得到了越来越广泛的应用。目前的研究热点是使多模终端能够同时接入多个网络,利用多种无线资源相互配合进行业务流传输。在这种通信模式下,当原有接入网络