论文部分内容阅读
随着近年来互联网中数据的海量增长以及人工智能的发展,对各种异构数据的处理能力也在不断的提高,知识以及知识间的关系逐渐受到行业发展的重视。知识图谱的产生使得互联网中的数据具有了较好的语义处理能力,但目前知识图谱仍处于正在发展的过程,远未达到完善的程度,知识图谱中虽包含了上亿条事实数据,但对不常用到的一些较冷门的知识尚未完全覆盖到,同时,仍存在部分可以通过简单的推理得到的知识也未被标识出。因此进行知识图谱的补全具有重要的意义。而目前对知识图谱补全的工作大都集中于对实体对间直接关系的补全,本文主要针对短路径中存在的部分事实关系的补全,并提出了一种知识图谱中语义路径组合关系的推理算法(简称CSPRRA)。针对目前知识图谱中隐含关系的推理问题本文工作如下:(1)针对以往知识推理的过程大都基于图结构进行,计算成本较高且扩展性能较差等问题,本文受知识表示学习的启发,利用Bordes A等人提出的翻译模型,将知识图谱嵌入到低维向量空间中进行计算,从而提高计算效率以及扩展性。(2)为挖掘知识图谱中路径上的信息,就需要获取到两个实体间存在的某种可达的路径信息,在本文中,提出了一种基于强化学习的路径发现模型,该模型利用了 Agent和环境的交互过程,在奖励函数的机制下,学习发现两个实体间的路径。为后续利用路径信息推理关系做铺垫。(3)在得到两个实体间可达的路径信息后,为更好的利用路径上的实体和关系,本文利用RNN模型可以处理任意长度序列问题的特性,将所得到的实体和关系的路径作为RNN的输入,经过迭代计算,最后将会得到一个组合了路径信息的结果向量,将该结果向量与目标关系向量进行相似度计算,最后通过相似度值来确定关系。最后,为了验证本文提出算法的有效性,对该算法进行了实验和分析,结果表明该算法有效的提高了结果的准确性和精确性。