论文部分内容阅读
随着社交媒体的快速发展,越来越多的用户开始同时使用多个社交网络平台进行通信、工作、学习和娱乐等活动,如何在各种不同社交网络中找出共同用户成为人们关注的重点,我们将这类问题称为网络对齐问题,将这里的共同用户称为锚节点。由于网络对齐可以被广泛应用于多个领域,比如网络融合、链接预测和跨网络的推荐等,所以本文的研究目的是去解决社交网络中的网络对齐问题。现有的一些方法可以解决网络对齐问题,这些方法一般包括两个部分,第一部分为网络的表示学习过程,即利用网络结构信息和用户的特征信息将每个用户表示成为一个特征向量,我们将这个特征向量称为节点的嵌入表示;第二部分是匹配过程,即在多个网络之间,学习一个匹配函数来预测锚节点。但是这些已有的方法仍然存在以下问题:1、匹配混乱:在网络表示学习过程中,相邻的用户节点被非常紧密地嵌入到单个网络空间中,使得相邻节点之间难以区分,但是在匹配过程中,我们需要区分真正对应的锚节点和邻居节点,所以这两部分的目标相互矛盾,从而导致网络对齐效果不理想;2、缺少不确定性信息:之前的模型将节点表示成简单的点向量,而忽略了用户节点的潜在不确定性信息;3、点对点(P2P)匹配限制:之前的很多方法采用点对点的方式去匹配锚节点,这将导致严重的过拟合现象,从而影响网络对齐的正确率;4、缺少模型的可解释性分析:之前的方法将模型当成一个黑盒子,并没有对网络对齐过程进行可解释性的分析,比如哪些训练数据对模型真正起到了作用?影响网络对齐表现的真正因素是哪些?在本文中,我们提出了dNAME和UANA这两种方法来解决上述问题,其中dNAME使用核方法和图神经网络来学习网络节点的嵌入表示,然后使用一个匹配函数来预测锚节点,由于核方法的应用,使得dNAME能够区分锚节点和邻居节点,从而解决了匹配混乱的问题。UANA采用高斯嵌入和图神经网络的方法去捕获网络中的不确定性信息,并且使用生成对抗匹配来解决点对点(P2P)匹配的限制问题。此外我们还对两种模型的可解释性做出分析,这使得我们可以更好的理解网络对齐模型。最后,我们在两个真实数据集上对所提出的方法进行验证,实验证明,我们提出的两种方法的网络对齐表现均优于其他方法。