论文部分内容阅读
异质信息网络普遍存在于现实生活中的许多情景中,如社交网络、学术引用网络、电影评论网络等。从这些网络中挖掘出有价值的信息是十分重要然而面临许多挑战的,主要的挑战是如何构建合适的信息网络节点表征。传统的信息网络节点表征方法是将网络看成由节点和边组成的图模型,并人为地抽取图中节点的特征作为节点的表征。但是这种方法十分依赖于专家的先验知识以及耗费大量的时间。因此,近年来为了解决以上问题,许多信息网络节点表征学习算法被提出来,旨在自动地学习网络中节点的表征。代表性的方法有基于图神经网络的网络节点表征学习算法。其通过聚合目标节点的邻居节点特征信息来获得目标节点的低维向量表征,但是目前的这类算法存在以下问题:一是其只关注了同质信息网络,即网络只包含了一种类型的节点和边,没有考虑到包含不同类型节点或边的异质信息网络;二是手工设计不同类型邻居节点的聚合策略是十分依赖专家的先验知识且不具有普适性的。为了解决以上问题,本文提出MetaGNN模型,一种基于已有的Deep Q-Network模型的图神经网络模型,该模型包含了两层结构,即Deep Q-network层和图神经网络层。其中Deep Q-Network层根据图神经网络层输入的的目标节点表征信息,自动地学习如何选择不同类型的邻居节点作为输出反馈给图神经网络层;图神经网络层根据Deep Q-Network层输出的邻居节点选择策略对目标节点进行表征学习,并将新的目标节点表征信息以及与下游任务相关的评价指标反馈给Deep Q-network层作为新的输入和奖励。该模型具有以下优势:一是该模型是一种端到端的信息网络节点表征学习模型,可以直接输出与下游任务相关的评价指标;二是该模型在不同领域背景的异质信息网络下具有普适性,不依赖专家的先验知识,可以自动地学习不同类型邻居节点的聚合方式;三是该模型对网络中新加的节点具有很好的泛化能力,可以有效地学习网络中新加节点的表征。为了评价模型的有效性,我们在三个真实世界中的大规模异质信息网络数据集上分别进行了归纳式与直推式节点多分类实验,并测试了模型的超参数敏感性。实验结果表明,我们的模型超过四个经典的信息网络节点表征学习算法。