论文部分内容阅读
知识图谱(Knowledge Graph)又称为科学知识图谱,是人工智能技术的组成部分,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础。但是由于互联网信息的爆炸增长,几乎每天都会出现大量未存在的关系和实体。与时俱进的更新消息,根据当今模型补全未存在的关系,从而将用户的搜索质量以及搜索体验进行改善,是当今知识图谱领域面临的挑战。从知识图谱的概念诞生之日起,各种各样开创性的模型被提出来,进行解决知识图谱补全问题。大部分模型都是将概念映射到空间中,根据模型中损失函数的定义,对模型进行优化。还有一部分将局部信息和结构考虑进来,进行图的搭建,对整个图进行优化。基于上述方法存在的问题,本文提出了一种基于概率图模型的方法以及应用该方法的计算模型,将知识图谱模型中的变量实体和关系映射到高维空间中。把每一个变量都看作空间中的一个结点,建立图网络。运用传统的机器学习方法,将整个概率图进行优化,从而使每一个变量都在空间中找到最适合它的位置,然后根据实体和关系之间的距离,判断该知识图谱三元组之间是否存在联系,进行知识图谱模型的嵌入。对于链接预测,根据结点之间的距离,判断两个节点间是否存在链接,进行图网络的完善。本文内容主要分为三个部分:1)基于马尔科夫随机场以及VAE模型,将图分为极大团,然后建立优化函数,优化encoder和decoder参数。2)基于循环置信度消息传播算法,将图模型中各个结点之间的影响看作消息,通过消息进行传递相互之间的作用。通过核函数的使用,将概率空间中的操作映射到嵌入空间中,从而直接对嵌入空间中的嵌入向量进行优化,获得合适的嵌入位置。但是根据以往资料,只考虑了观测变量到隐变量之间的参数。借鉴tranE中得分函数,建立隐变量之间的距离关系,对模型进行优化。3)基于循环置信度消息传播算法,也是通过消息传递结点之间的影响。但是与上不同的是考虑解码的作用。在本文的最后,对模型进行对比试验,对比试验分为两部分,一部分是知识图谱实体预测研究试验,这部分主要和现如今比较流行的一些知识图谱模型进行对比,如Trans系列模型。另一部分是链接预测研究,这部分主要和一些图嵌入模型进行对比,如Deepwalk等图嵌入模型。通过对比试验可以看到,模型在两个部分都有不错的性能。