论文部分内容阅读
在线社交网络和电子商务的快速发展吸引着越来越多的人参与其中,获取丰富的用户属性有利于运营商更好地定位目标用户和设计个性化的推荐系统,属性推断就是一种用来预测节点的未知属性和潜在特质的技术手段。目前属性推断提取的特征往往存在维度高且稀疏的问题,同时单属性推断模型忽略了属性之间内在的相关性,导致属性推断存在准确率不高、效率低等问题。本文主要研究基于网络表示学习的节点属性推断算法,在不同的应用场景下设计合适的网络表示学习算法来自动地学习节点的低维特征表示,以此来解决属性推断中传统特征提取存在的问题;同时考虑不同属性之间的相关性,探索合适的预测模型实现同时推断多个节点属性。本文的主要研究内容如下:(1)提出了一种基于社交嵌入的结构化属性推断算法。将在线社交网络用户的好友关系嵌入到一个低维向量空间中,同时提出将多个用户属性编码成一个结构化属性向量,最后设计一个多层神经网络模型用于捕捉用户社交嵌入与结构化属性向量之间复杂的非线性映射关系,以此来提高属性推断准确率。(2)提出了一种基于用户节点嵌入的多属性推断算法。基于购买记录提出一种新的用户节点嵌入算法,通过构建有向权重二部图和有偏置的随机游走获取上下文语料库,最后利用Word2Vec训练获取每个节点的向量表示,这种嵌入算法学得的节点表示与传统降维方法相比包含更多的特征信息。同时提出一种多属性推断模型,将用户节点嵌入算法学得的向量表示作为输入,联合优化多个属性推断任务损失,利用多个任务之间的相关性,实现相互促进的目的。总体来说,本文主要研究利用网络表示学习算法获取节点的低维特征表示,同时考虑多个属性的内在相关性,探索新的模型实现多属性同时推断。通过在真实的社交网络和购买场景数据集上进行大量对比实验,验证了本文的用户节点嵌入算法学得的特征表示包含更丰富的属性信息,同时提出的结构化属性推断方法和多属性推断模型实现了属性推断效率和准确率的提升。