异质图嵌入技术及其应用研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:mahongxin2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,每天都有海量的数据产生,因此如何组织这些数据就成了一个非常关键的问题。事实上,生活中的大部分数据都可以通过网络,或者说是图来刻画。例如,人们的社交关系可以构建出一个社交网络,人作为结点,人们之间的联系作为边。基于此,图嵌入技术开始逐渐兴起。图嵌入本质上是一种表示学习的方法,它将图映射到低维空间,同时保留图的结构信息以及结点本身的属性。这对于许多下游任务都有非常显著的提升,例如节点分类,链接预测,推荐系统等等。本文主要研究基于神经网络的图嵌入方法。从最早的基于随机游走的模型开始,各种各样的基于神经网络的图嵌入模型被提出来。近期效果比较好的模型是图卷积神经网络(GCN),它通过卷积层来聚合结点周围的邻居结点,从而学习局部的邻居信息。然而这种方法输入的是单个的结点,只能学习到有限的局部信息,而且邻居的定义比较固化。基于存在的上述问题,本文提出了一种新的子图卷积网络,它以子图而不是单个结点作为模型的输入。首先根据已有的数据构建异质图,把实体抽象成结点,实体间的联系抽象成边。在整个图中抽取出一个个的子图,并学习子图的嵌入表示,从而将子图输入进子图卷积网络,聚合子图的信息,学习结点的嵌入表示。本文主要以推荐系统作为应用场景,推荐系统可以看作链接预测的问题,即预测用户与项目之间是否会有链接(点击)。本文的主要内容如下:1)研究分析了当前图嵌入技术以及推荐系统的发展现状,并规范化表示基于图网络的推荐问题,在该问题中,用户和项目以及它们之间的联系都以异质图表示。2)基于本文提取子图的需求,结合本文的应用场景,提出了两种子图提取的方式并分析其优缺点。3)针对当前图卷积网络的缺陷,提出一种新颖的子图卷积网络。从整个巨大的图中生成自定义的子图,借鉴自然语言处理中的做法,学习子图的嵌入表示。同时子图相对于将所有一阶二阶邻居信息一起卷积,也更加灵活。而且由于输入的是子图,已经包含了相对丰富的邻居信息,那么在后续的卷积操作中,就可以减少卷积层的个数,有利于提高效率。4)本文采用了同时学习的策略,也就是说,图嵌入和下游的链接预测任务同时进行学习,这样可以有针对性的提升任务效果。最后,本文使用真实数据集进行了大量的对比实验,包括与其它模型的对比以及模型本身不同参数的对比。通过对比实验可以看到,本文提出的模型有较好的效果。
其他文献
钛铝系金属间化合物在最近受到了人们的广泛关注,这是因为钛铝系金属间化合物的密度很低,比强度很高,并且在高温下的抗氧化性能良好,是非常理想的航空材料。Ti-A1系金属间化
目的:比较咪达唑仑复合芬太尼联合镇静和氯胺酮、异丙酚等全身静脉麻醉两种麻醉方法的差异。方法:应用咪达唑仑复合芬太尼联合镇静组30例,施氯胺酮和异丙酚全麻30例,对两组穿
二维套料问题是将多个零件在二维平面内进行排布,要求零件不重叠,并满足一定的工艺要求。本文受到日常生活中的"摇瓶子"和振捣、夯实等现象启发,将套料问题与力学(运动学和动
<正>求解椭圆有关问题时,常常要利用椭圆的四个基本元素a,b,c,e之间的关系(a2=b2+c2,e=c/a)及相应的几何意义.下面举例说明.一、挖掘几何条件,利用椭圆的定义解题例1已知P是以F
在一些集团公司中普遍存在多个子公司之间的间接交叉持股现象,而现行准则及指南并没有给出具体的会计处理方法。本文根据子公司之间间接交叉持股形成的个别层面与合并层面的
通过野外调查研究了松嫩草地中五脉山黧豆、野豌豆这两种广泛分布的豆科植物的地上生物量分布特征与土壤因子的关系。结果表明,五脉山黧豆地上生物量分布的最大值为286.25 g/
现代高科技企业实力的竞争,是科技实力的竞争,归根结底是掌握核心技术的专业技术人才的竞争,所以,人才成为高科技行业科技进步和企业发展的第一资源,尤其是目前国内系统集成企业面对系统集成行业残酷的竞争环境,企业出现了大量专业技术人才流失,给科技企业的核心竞争力带来巨大影响,其中,持证专业技术人才的流失,致使企业面临资质保级难、升级难的严峻形势,如何培养、吸引和使用好专业技术人才,留着人才,构建起科学的系