论文部分内容阅读
大数据时代下,互联网上时刻会有海量的各种结构类型的数据被产生。如何操作这些海量的数据并获取其中的有用信息,受到了普遍的关注。知识图谱(Knowledge Graph,KG)将各种结构化数据的语义信息以计算机可以理解的方式表示出来,有助于我们更好地组织和管理数据。而现有的KGs并不完整,这大大限制了知识图谱的运用。因而,有必要发掘KGs中隐含的信息以实现知识推理,来完善KGs。知识图谱是一个由相互关联的知识组成的复杂的语义网络,其中实体(entity)被视为该网络的结点,实体间的关系(relation)则被视为该网络的边。知识表示学习的目的是学习KGs中的实体和关系并计算其语义联系。该技术可以有效提升知识获取、表示和推理的性能,因此,本文在知识表示学习的基础上进行进一步研究,具体内容如下:(1)针对不同知识图谱的个体局部性问题,提出一种动态边际(DM)翻译原理,并将该原理引入经典TransE模型。首先,在训练过程当中,针对不同的KGs设置不同的模型参数。其次,根据训练次数的增加,动态优化损失函数的边际值,有效地改善了不同KGs的独特性问题,从而提升了训练效率。(2)知识图谱中,路径作为除关系外连接两个实体的另一种方式,也蕴含着实体间丰富的语义信息。加入路径的表示学习模型如PTransE,在实体对间仅包含一条路径的情况下取得了显著的改进。但是,当实体对之间的路径数大于1时,这些模型对于多路径并不能很好地建模。介于此,本文提出了一种动态路径翻译(DPT)原则。DPT有针对性的添加与各条路径相对应的向量因子,并将这些向量因子与实体向量和关系向量同步训练,来实现对实体对间的多条路径的建模。(3)现有基于路径的知识表示学习模型仅加入了两到三步路径。为了更好地反映KGs中的复杂推理,本文利用长短时记忆网络结构对一条路径中的多个关系依次进行迭代组合操作,来增加嵌入路径的长度,捕捉相距较远的实体之间所隐含的语义信息。并且,训练过程中采用改进的路径约束分配资源算法即im-PCRA算法,计算实体对之间每条路径的可靠性。