面向聚类与链路预测的网络表征学习算法研究与应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:wg245940815
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络数据规模的快速增长,传统的网络表示方法已经成为限制大规模网络处理和分析的瓶颈,如何通过网络表征学习将原本高维的网络数据在低维向量空间中进行表示成为了值得研究的一个问题。一种有效的方式是将网络映射到一个低维向量空间中,即使用低维向量来进行网络的表示。网络表征学习可以将高维稀疏的网络矩阵在低维空间中采用稠密且连续的向量进行表示。对采用了网络表征学习算法处理后的网络而言,由于其摆脱了邻接矩阵中边的约束,使得网络中的每个节点都可以通过低维空间中一个独立的特征向量进行表示,进而可以基于得到的低维向量支持后续的应用。本文将根据网络的局部相似性与网络动力学对静态网络和动态网络的表征学习算法进行研究,主要的研究内容包括下述几个方面:(1)对于目前静态网络表征学习算法的不足,本文提出了一种基于自编码器的静态网络表征学习算法。该算法通过随机游走得到原始网络的概率共现矩阵,然后利用词表征学习中的方法结合网络节点及概率共现矩阵得到网络的正向逐点互信息矩阵,最后利用深度学习中的半监督自编码器结构来学习网络的结构信息,将原始网络使用新向量空间中低维稠密的向量表示。在实验验证方面,通过将本文提出的算法与目前表现优异的多个算法在不同数据集上进行多个任务的实验,并根据多个评价指标来衡量算法在不同任务上的性能表现。(2)于此同时,考虑到现实世界中的网络都是具有动态性的,并且目前动态网络表征学习算法还存在很大的发展空间,本文提出了一种基于图卷积的动态网络表征学习算法。为了处理复杂的动态网络数据,该算法首先利用卷积的思想学习整个网络的结构,采用图卷积神经网络来处理这种非欧式空间数据;随后将图卷积神经网络得到的网络特征向量交由循环神经网络处理,进而学习动态网络中潜在的时序信息,从而得到动态网络在低维空间的表征向量;最后交由解码过程将表征向量进行重构,得到下一时刻网络的整体结构,并计算与原始输入数据间的误差,通过反向传播调整网络模型中的参数,最终实现在得到网络表征向量的同时预测下一阶段网络结构。(3)针对于提出的上述算法,本文将其应用于专家合作者网络预测系统,从而实现专家合作关系的预测。该系统利用网络表征学习算法在DBLP数据集上得到的网络表征向量为依托实现专家关系的预测,并对学习到的向量进行了可视化展示,最终通过使用Web应用开发技术实现了本系统。
其他文献
光催化作为一种新型的光能转化技术,由于其环境友好的特性已在世界范围内被广泛研究,设计和合成高效的光催化剂已经成为光催化研究领域的焦点问题。在众多的光催化材料中,以金属氧化物(如TiO_2)为代表的光催化剂由于其无毒,且地球储量丰富等特性被研究者们认为是一种理想的光催化材料。然而大多数金属氧化物禁带宽度较大且量子效率较低,导致其太阳能利用效率低下,这些缺点严重的限制了其在光催化能源转换上的应用。针对
在风险社会,公司大规模侵权事件频发,在公司侵权事件中的受害者即为非自愿债权人。与普通侵权行为相比,公司侵权所波及的被侵权的一方必定范围更广、规模更大,因此在公司侵权案件中,在对受害人加以保护时,必得与公司的特殊性结合起来。本文主要论述针对公司非自愿债权人的特殊保护,探讨切实保护公司非自愿债权人合法权益的方法途径。本文第一部分论述对公司非自愿债权人进行特殊保护的法律基础,从我国目前非自愿债权人“维权
催化方法有万千种,不对称氢化无疑是其中合成手性化合物最快速最高效的方法之一。其中β-酮酸酯通过不对称氢化反应生成的手性β-羟基酯,是合成手性药物和天然产物的重要骨架
当前,开发环境友好、清洁可持续再生的新型能源已成为全球科学家关注的研究热点。电解水技术是基于电化学或光电分解水的原理,利用可再生的电能或太阳能使水分解为氢气(析氢反
负载贵金属型多相催化剂由于其在精细化学品的有机合成方面具有杰出的选择性和循环使用性,已经广泛应用于工业合成和学术研究中。而钯基催化剂具有寿命长、价格相对低廉和易
当前日趋严峻的能源形势使得新能源的开发利用和化石能源的高效利用受到广泛的关注。费-托合成(FTS)作为一种将合成气高效催化转化为清洁能源和高附加值化学品的重要方法,未来有望替代化石燃料维持能源供给。目前,钴基催化剂由于其优良的性能和适宜的价格在工业中广泛应用。对于钴基FTS催化剂而言,催化剂的活性和产物选择性与钴纳米颗粒电子结构及几何结构密切相关,具体取决于钴纳米颗粒的尺寸、形貌和晶相。热分解法作
2001年证监会出台了《关于在上市公司建立独立董事制度的指导意见》,从此正式建立起我国的独立董事制度,该制度的颁布表明了独立董事在公司治理中的重要地位。独立董事制度出台至今已有十余年,但是有关独立董事作用、背景、治理效果的研究仍存在一定的争议,需要后续开展研究。我国资本市场建设尚未成熟,银行借款仍是上市公司进行债务融资的主要方式,但目前多数公司仍然面临着融资难和融资贵的问题。本文研究发现银行背景独
随着太赫兹技术的迅猛发展,对于太赫兹辐射源的研究也逐渐成为热点。太赫兹辐射源的高信噪比、宽频带和光子能量低的优点,使其在医学、科技、军事和基础研究等方面都得到了广泛的应用和快速的发展。在对于太赫兹辐射源的开发和研究方法中,采用真空电子学技术来产生太赫兹辐射源的方法逐渐引起研究者们的关注。本论文中主要研究的是平行多注太赫兹辐射源,先设计并优化平行多注电子光学系统,使电子注能够平行稳定的传输;为了便于
商业信用是企业重要的融资手段,在我国以信贷市场为主导的金融体系中显得更加重要。由于信贷主渠道融资的困难客观存在,企业为了生存和发展往往还得寻求其他替代的融资方式,而商业信用则是一种被企业普遍采用的融资方式。自《萨班斯—奥克斯利法案(SOX)》颁布以来,内部控制逐渐成为会计与审计领域的热点的问题之一。在内部控制对商业信用融资影响的研究中,学者们往往是从内部控制质量这个正面、静态的角度直接考察内部控制
长三角地区是我国经济发展最活跃、开放程度最高、创新能力最强的区域之一,在国家现代化建设大局和全方位开放格局中具有举足轻重的战略地位。青浦背靠大虹桥综合枢纽,面向苏