论文部分内容阅读
近年来,信息技术不断完善,语义网技术不断成熟,传统的文本搜索逐步转向语义搜索,知识图谱(KG,Knowledge Graph)也随之发展成为工业界和学术界的研究热点。结合外部数据集(例如,标签数据集),基于概率图模型进行知识图谱的链接预测,即知识图谱中缺失信息的发现和还原,是目前知识图谱领域研究的热点和关键。本文以电子商务应用为背景,基于已经构建好的描述用户兴趣的知识图谱,结合外部数据集,以贝叶斯网这一重要概率图模型作为不同商品之间相似性及其不确定性的表示和推理框架,通过对商品属性进行统计计算,构建反映商品之间相似关系的贝叶斯网,进而利用近似推理方法,判断商品实体节点与用户实体节点之间存在链接的真实性,得到更为完整和真实的知识图谱,为个性化推荐和关联查询提供依据。具体而言,本文的主要工作如下:(1)现有KG中属性节点信息单一,描述实体属性的数据不够充分,而现实世界中含有大量与用户KG相关联的外部知识——标签数据集。本文以电子商务应用为背景,针对已经构建好的描述用户兴趣的KG,KG中的实体对应为商品实体,将KG中信息和外部数据集相结合,基于商品之间相似性构建了用于KG链接预测的LBN(LBN,Link Bayesian Network),提高链接预测的准确性。(2)针对LBN模型构建问题,对于结构学习,本文基于商品实体之间的相似性来构建包含商品节点的模型结构;对于参数学习,我们选择常用的极大似然估计算法来计算条件概率表。(3)为了实现高效发现LBN中具有相似关系的商品节点,同时便于扩展到大规模KG,我们利用贝叶斯网的概率推理机制,给出基于Gibbs采样算法的LBN概率推理,量化了未知链接真实存在的可能性,基于此实现了 KG链接预测。(4)基于MovieLens站点数据,本文实现并测试了LBN的构建、近似推理方法,同时验证了链接预测的有效性。为了完善我们的研究内容,我们根据本文提出的方法,基于Web服务设计了“基于贝叶斯网的知识图谱链接预测”原型系统。