基于深层神经网络模型的时序网络表示学习研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:renewmyself
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络通常用来定义复杂的数据关系,其节点表示实体,边表示实体之间的交互关系。真实世界中,网络的节点和边往往不是静止的,而是随着时间不断演化的,这样的网络称作时序网络。例如在社交网络中,其节点表示用户,边表示用户之间的交互关系,网络中用户的数量和用户之间的交互关系不是固定的,而是随着时间不断演化的。网络节点的特征表示是分析时序网络的重要方法之一,旨在从网络中提取具有表征力的特征,用于下游的链路预测、节点分类等网络分析任务。近年来,随着互联技术、社交媒体技术等不断发展,网络的规模不断扩大,给传统基于矩阵特征向量的谱聚类、矩阵分解等特征表示方法提出挑战。此外,网络中还包含着丰富的异构信息(如节点属性、离群值等),这些特点使得现有网络特征学习方法更不能很好地处理这类大规模网络,因此出现了基于神经网络模型的网络表示学习方法。网络表示学习(Network Representation Learning)即网络嵌入(Network Embedding),旨在为网络中的每一个节点学习一个低维的表示向量,该向量蕴含了网络的空间拓扑信息、时间信息和异构特征信息等,并能够应用于下游的网络分析任务,如链路预测、节点分类和社团检测等。大量研究证实:与基于浅层神经网络表示学习方法相比,基于深层神经网络的表示学习方法在提取高维非线性特征上更具优势,在后续网络分析任务中表现性能更好,因此本文研究基于深层神经网络模型的时序网络表示学习方法。本文研究内容和主要贡献总结如下:一,研究利用网络节点间二阶权重采样的时序网络表示学习方法。时序网络可以按离散的时间点把网络分成多个快拍(序列图),研究如何把网络的多个快拍合并成一个快拍进行有效的特征提取,以提高表示向量在后续任务上的性能。时序网络中,为网络的每一个快拍的每一个节点提取其空间拓扑结构关系能够作为该节点有效的特征表示。但是,现有的工作只考虑随机游走根据节点的直接邻居的权重来提取节点特征。真实网络中,一个节点的邻居的邻居同样拥有该节点有用的信息,因此应该联合考虑这些权重来提取特征。本文从网络节点特征采样角度出发,提出了时序网络嵌入模型:TT-GWNN。在该模型中,本文提出了根据二阶权重的随机游走采样算法(Second-order Weighted Random Walk Sampling Algorithm)来提取网络的空间拓扑特征和时间特征,该算法把网络快拍的一阶权重和二阶权重合并成一个权重图,并利用一个衰减指数分配更大的权重给离当前快拍更近的快拍。然后,根据该权重图为网络中的每一个节点提取特征。实验现象表明:该采样算法能够有效增加特征提取空间,在更稀疏的网络上效果更显著。然后采用图的小波神经网络(GWNN)来嵌入提取的特征。最后,通过链路预测实验证明了该方法的有效性。二,研究利用网络快拍间截断层次游走采样的时序网络表示学习方法。研究采用何种策略来有效地联合时序网络的多个快拍共同提取网络特征。时序网络中,当前快拍的空间结构关系是由先前快拍的空间结构关系演化而来,先前快拍中同样也蕴含了当前快拍的一些有用的空间结构信息,因此联合先前快拍为当前快拍提取空间结构特征非常有必要。本文从网络节点特征采样角度出发,提出了时序网络嵌入模型:ST-HN。在该模型中,本文提出了一个截断的层次随机游走采样算法(Truncated Hierarchical Random Walk Sampling)来提取特征,该算法为当前快拍的每一个节点随机地从当前快拍游走到先前快拍采样特征,并利用一个衰减指数分配更大的游走步数给离当前快拍更近的快拍。实验现象表明:该算法能够有效地捕获节点的演化行为。然后,改进先进的模型:高阶图卷积神经网络(Mix Hop)来嵌入提取的特征,改进的模型能够聚合多跳邻居间的空间结构特征和时间特征。最后,通过链路预测和节点分类实验证明了该方法的有效性。三,研究带属性的时序网络存在离群节点(Outliers)的时序网络表示学习方法。研究如何处理这些离群节点来减少对正常节点嵌入向量的影响以提高向量在后续任务上的性能。时序网络中,网络的节点还包含丰富的属性信息,这样的网络称其为带属性的时间网络。在带属性的时序网络中,一个节点的拓扑结构或节点的属性相似性可能偏离自己所属的社团,这样的节点称其为离群节点。相关研究表明:这些离群节点能够严重影响正常节点的嵌入向量在后续任务上的性能,然而在带属性的时序网络嵌入中,先前的工作并没有明确考虑这些离群节点。本文提出了一个基于自编码和解码并考虑离群节点的带属性的时序网络嵌入模型:TAOA。在该模型中,提出了一个自编码解码架构,该架构联合先前快拍和当前快拍为当前快拍的每个节点学习嵌入向量,在编码和解码过程中考虑了减小离群节点对正常节点嵌入向量的影响。在特征预处理阶段,提出了一个简化的高阶图卷积神经网络框架(Simplified Higher Graph Convolutional Mechanism)来合并属性特征到拓扑特征,增加了拓扑结构特征稠密性,降低了嵌入模型输入向量的维度,更有利于大规模网络分析。最后,通过链路预测和节点分类实验证明了该模型的有效性。
其他文献
在日常生活的实践中,女性的身材焦虑问题很普遍。女性常因为对身材的不满而影响到自我的认同。视觉文化带来了“颜值即正义”,消费社会使得女性不断地进行身体商品化的实践。本文通过对16位90后女性的访谈,结合身体控制权、女性独立等,试图分析女性的身材焦虑是怎样在宏观社会背景下被建构的。本文首先分析了身材焦虑在日常生活中是怎样呈现的。女性的身材历来是被社会定义的,变胖是现时代女性的身材焦虑。身材焦虑呈现普遍
学位
报纸
尽管现代医疗技术进步很快,但冠心病患病人群的患病率、入院率仍在不断攀升。而在冠心病患者中有相当一部分人存在不同程度的睡眠质量问题,睡眠质量的好坏会直接影响冠心病病人的康复(包括介入治疗术后的康复),最终会影响冠心病的转归。随着生物-心理-社会医学模式的确立,心理因素在各种疾病发生、发展中的重要作用逐渐为人们所知,并引发了研究者的广泛关注。本研究探讨了影响冠心病介入治疗术后康复期患者睡眠质量的心理因
学位
二十世纪下半叶,众多法国作家纷纷将目光投向自身,以自我为起点进行思索和创作。1977年,“自我虚构”这一新兴文学概念由法国文学批评家、作家杜布洛夫斯基提出,很快成为法国当代文学最显著的潮流特征之一。而在这一术语问世之前,很多作家就已经进行过类似的探索,那些以第一人称书写的小说,或多或少都沾染了“自我”与“虚构”的色彩。《小王子》是法国飞行员作家圣艾克絮佩里流传最广也最受欢迎的作品。如果说这本披着童
学位
为开发利用里海资源,稳定里海地区秩序,里海五国围绕里海法律地位等问题展开了长达22年的谈判,最终在2018年8月12日第五届里海沿岸国元首峰会上签署了《里海法律地位公约》。公约基于里海地区的历史传统、地理特征和政治现实,借鉴吸收了现行海洋法律制度和国际湖泊制度,通过规定独具里海特点、内容相互联系的区域活动、水域和底土划分、共同利用及海底管道铺设等相关内容,“确定”了里海“非湖非海、湖海兼具”的特殊
学位
<正>今年是全面贯彻党的二十大精神的开局之年。习近平总书记强调,要坚持真抓实干,激发全社会干事创业活力,让干部敢为、地方敢闯、企业敢干、群众敢首创。站在跨越发展的时代风口,迫切需要广大干部把敢为善为融入基因血脉,提振干事创业信心,以干部敢为善为示范带动地方敢闯、企业敢干、群众敢首创。
期刊
森林是地球上最大的陆地生态系统,对维护全球生态平衡和促进全球物质能量循环具有积极重要的作用。森林中单木的树高和胸径是森林资源调查的基本任务,是刻画森林生长状态和发展趋势的重要指标。森林地上生物量反映了森林固碳能力,是评价森林生态功能的重要指标。传统的森林资源调查依靠人工野外调查,其周期长、劳动强度大。遥感技术为研究森林资源现状和森林动态变化提供了快速、高效的观测手段。光学遥感影像可以提供植被的光谱
学位
重金属污染问题因其毒性、不可降解和生物积累等特性,严重危害污染地区人民的生命健康和农业经济发展,成为我国目前最急需解决的土壤生态难题之一。2019和2020年度《中国生态环境状况公报》均强调“重金属为影响农用地土壤环境质量的主要污染物,其中镉(Cd)为首要污染物”。2014年《全国土壤污染调查公报》显示Cd的点位超标率为7%,占重金属首位。中国农业用土壤Cd含量的二级标准值为0.25~0.6 mg
学位
<正>龙虎塘街道中心幼儿园(以下简称龙幼)人是善于创造的,这种生生不息的创造力究竟从何而来?这不是一个大脑的产物,而是基于人与人之间的深度联结,龙幼人已经形成了“同气相求”的状态。而这背后彰显的是龙幼的管理智慧——将润泽理念渗透到项目日常并做到眼中有人,关注每个教师的发展需要,
期刊
目的:探讨UTF1蛋白在乳腺癌组织中的表达水平和临床意义及其对乳腺癌细胞生物学行为的影响。临床资料与方法:收集绍兴市人民医院乳甲外科2009年1月至2011年12月乳腺癌术后组织标本221例,同时整理相关临床信息及随访资料。通过免疫组织化学方法评估肿瘤组织中UTF1的表达,统计分析这些乳腺癌组织中UTF1蛋白的表达与临床意义。构建UTF1过表达的Bcap37稳转细胞株及转染si RNA下调UTF1
学位