基于自编码器的在线网络表示学习算法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:szywit01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络在生活和生产中无处不在,例如社交网络,而网络表示学习(也称网络嵌入)是一种对网络型数据非常有效的处理方法,其旨在为网络中的每个节点都学习一个低维的向量表示。在现实世界中许多网络都是动态的不断变化的,然而大部分现有的算法只能对静态的网络取得较好的效果。动态网络通常可以分成两类:一种是随着时间推移其拓扑图的节点和边会增加或者减少;第二类则是网络的边会包含时间信息,如电话网络。动态网络表示学习算法大多基于静态网络学习算法,常常会受到动态网络结构的复杂性、变化的多样性和信息的丰富性三大挑战。
  在本文中,我们提出了循环网络嵌入(Recurrent Neural Network Embedding,RNNE)的算法来处理动态网络。RNNE主要基于神经网络模型,使用了自编码器(Autoencoder)结构和循环神经网络(Recurrent Neural Network,RNN)来适应动态网络表示学习的特点。其主要技术和创新点如下:
  1.为了解决动态网络的规模可能频繁改变的问题,RNNE在网络中添加了不和其他任何节点相连的虚拟点,并且在新的节点产生时替换它们以保持网络在不同时间点规模和结构的统一。
  2.为了增强节点特征的表达能力,RNNE没有直接使用网络的邻接矩阵作为特征矩阵,而是通过计算多步概率转移矩阵并进行加权求和的方式来计算每个节点的特征。
  3.RNNE通过关注节点间直接相连的边和节点邻居的相似度,认为直接相连的边和相似的邻居都能带来节点间相似度的提高,以此来保持网络的局部和全局的结构特征。
  4.RNNE通过传递先前时刻的嵌入状态来充分利用网络演变过程中留下的信息,然后通过维持不同时间点嵌入向量的稳定性来减少由于网络波动和噪音的影响。
  5.RNNE作为一个在线网络表示学习的算法,其各个模块的功能相对独立,又互相联系,具有较好的实时性。
  因此,RNNE在进行网络表示学习训练的时候兼顾了网络的静态和动态特征。
  在实验部分,我们在5个数据集上测试和比较了RNNE与其他几个最新的算法,并进一步研究了RNNE超参数对实验效果的影响。结果表明了RNNE相比于这些算法在网络重构、节点分类和链路预测上有着更大的优势。
其他文献
松嫩平原是世界三大苏打盐碱土地区之一,其土壤中高CO32-/HCO3-含量和pH值胁迫以及低氮营养胁迫使得植物难以生存,进而形成独特的碱斑形态。然而,本研究观察到在碱斑裸地上可以按照碱蓬→碱茅→羊草的顺序逐渐恢复植被群落,而植被根际微生物多样的代谢功能可能正是减轻上述苏打盐碱土多种胁迫作用的关键因素。因此,本研究以位于松嫩平原盐碱地长期试验基地的裸地碱斑土壤、恢复的碱蓬、碱茅和羊草根际土壤为对象,
硒是人体必需的微量元素之一,具有多种生物学功能,目前已知人体的40多种疾病都与缺硒有关。中国缺硒省份多达22个,缺硒地区面积占国土总面积的72%。调查结果显示,我国成人日均硒摄入量与国际硒学会推荐的日最低摄入量相差甚远。人体所获得的硒90%来源于食物,通过提高农作物可食用部分的硒含量,进食生物硒是最为安全有效的补硒途径。黄瓜(Cucumis sativusL.)对硒有一定的富集能力,作为我国设施栽
学位
该文主要从机理与实验两个角度出发研究新型低温催化吸附剂——活性炭纤维(ACF)的脱硫性能,主要内容如下:通过一些物理化学的分析手段对ACF进行了表面与结构表征.通过BET比表面积方法分析了ACF的孔的分布以及吸附等温线;通过X射线光电子能谱(XPS)分析对ACF进行了表面元素分析,并利用能谱图对ACF活化前后的结构变化进行了比较充分的研究与推测.ACF的动态脱硫性能实验.分别进行了GAC、ACF动
学位
城市轨道交通具有运量大、安全、便捷等优点,是解决各城市交通拥堵问题的首选方法。随着我国城轨运营里程快速增加,其城轨再生制动能量回馈系统也大量随之投入运行。城轨再生制动能量回馈系统运行环境复杂多变,频繁的处于开、停机状态,并且受到较高电压的冲击。因此,在实际运行中,再生制动能量回馈系统中逆变器的功率元件IGBT极易发生故障。通常逆变器中IGBT故障主要包括IGBT短路故障和IGBT开路故障。由于IG
学位
随着人类社会发展对能源需求的不断增加,化石能源短缺的问题逐渐引起了人们的重视。可再生能源以分布式电源的形式规模化地接入到配电网中,改变了配电网的拓扑和潮流。在配电网发生故障后,对配电网的安全可靠运行提出了新的要求。  本文通过调研分析国内外现行配电网故障区段定位方法,基于遗传算法以及粒子群算法,提出了一种新的含分布式电源的配电网故障定位方法,论文主要工作如下:  首先给出了分布式电源的简介,包括风
学位
该论文主要研究配电网规划,包括配网网架规划和配网重构,以及为之服务的负荷预测.配网网架规划又包括水平年网架规划和多阶段网架规划.对负荷预测,主要介绍了负荷预测的常用方法和各种方法的优缺点,并提出改进的人工神经元网络法用于负荷预测,以及算法实现和算例分析.对配网网架规划和配网重构,在综合各种方法的优缺点的基础上,提出了改进的多种群遗传算法用于配网网架规划和配网重构.并针对配网的特殊约束条件,提出了行
近年来,随着机器学习技术的兴起尤其是深度学习技术的蓬勃发展,人类社会迎来了人工智能的黄金时代。在新时代背景下,大量卫生保健数据加速创建,传统医疗正逐渐向智能模式转变。如何从海量电子病历中获得有价值的医学信息,是智慧医疗发展的需求,也是目前构建智慧医疗体系所面临的重大挑战。  相关实验研究表明,大量的准确标注的训练样本是使用机器学习方法获得准确率高、泛化性能好的模型的基础。然而,在医疗领域,对于某些
学位
随着各种数据密集型应用(如智能终端、多媒体、自主交通和虚拟现实)的兴起,第五代(the Fifth Generation,5G)移动通信系统的主要需求是增加容量、提高数据速率、减少延迟和改进服务质量。针对上述需求,迎接未来的挑战,一些关键的技术被提出,如非正交多址技术、物理层传输技术、大规模天线和毫米波。其中,速率分割多址技术(Rate Splitting Multiple Access,RSMA
多智能体路径规划问题是为多个智能体在地图上寻找它们从各自不同的起始位置到目标位置的无冲突路径集合的问题,属于NP-hard问题。该问题作为人工智能领域的重要问题之一,在物流仓储、交通控制、机器人等领域中也有非常多的应用。在研究该问题的历程中,产生了次维扩展、代价增长树路径搜索和基于冲突的路径搜索等求解方法。次维扩展作为其中表现最好的方法之一,是一种具备完整性和最优性的多智能体路径规划问题求解框架。
学位