基于贝叶斯网的知识图谱链接预测

被引量 : 0次 | 上传用户:pretter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,信息技术不断完善,语义网技术不断成熟,传统的文本搜索逐步转向语义搜索,知识图谱(KG,Knowledge Graph)也随之发展成为工业界和学术界的研究热点。结合外部数据集(例如,标签数据集),基于概率图模型进行知识图谱的链接预测,即知识图谱中缺失信息的发现和还原,是目前知识图谱领域研究的热点和关键。本文以电子商务应用为背景,基于已经构建好的描述用户兴趣的知识图谱,结合外部数据集,以贝叶斯网这一重要概率图模型作为不同商品之间相似性及其不确定性的表示和推理框架,通过对商品属性进行统计计算,构建反映商品之间相似关系的贝叶斯网,进而利用近似推理方法,判断商品实体节点与用户实体节点之间存在链接的真实性,得到更为完整和真实的知识图谱,为个性化推荐和关联查询提供依据。具体而言,本文的主要工作如下:(1)现有KG中属性节点信息单一,描述实体属性的数据不够充分,而现实世界中含有大量与用户KG相关联的外部知识——标签数据集。本文以电子商务应用为背景,针对已经构建好的描述用户兴趣的KG,KG中的实体对应为商品实体,将KG中信息和外部数据集相结合,基于商品之间相似性构建了用于KG链接预测的LBN(LBN,Link Bayesian Network),提高链接预测的准确性。(2)针对LBN模型构建问题,对于结构学习,本文基于商品实体之间的相似性来构建包含商品节点的模型结构;对于参数学习,我们选择常用的极大似然估计算法来计算条件概率表。(3)为了实现高效发现LBN中具有相似关系的商品节点,同时便于扩展到大规模KG,我们利用贝叶斯网的概率推理机制,给出基于Gibbs采样算法的LBN概率推理,量化了未知链接真实存在的可能性,基于此实现了 KG链接预测。(4)基于MovieLens站点数据,本文实现并测试了LBN的构建、近似推理方法,同时验证了链接预测的有效性。为了完善我们的研究内容,我们根据本文提出的方法,基于Web服务设计了“基于贝叶斯网的知识图谱链接预测”原型系统。
其他文献
主成分分析、因子分析、聚类分析是三种比较有价值的多元统计方法,但同时也是在使用过程中容易误用或混淆的几种方法。本文从基本思想、数据的标准化、应用上的优缺点等方面,
介绍了橄榄石型L iFePO4正极材料的优缺点和造成L iFePO4导电率和锂离子迁移率低的原因,讨论了近年来各种制备L iFePO4的方法以及改性研究,并对今后的发展方向作出了展望。
美国货币市场基金在利率市场化进程中扮演了非常重要的角色,成为利率市场化的助推器。本文回顾了美国利率市场化完成阶段货币市场基金的发展过程和商业银行的应对措施,分析了
石油资源开采之后需要进行处理之后运输到各个地点,方便用户的使用,油罐区是石油资源主要的储存处,极易造成污染,降低石油企业的经济利益,也会造成对周边环境的污染,影响到企
《阳光照耀在塔什库尔干》是一首根据吐尔逊卡的尔创作的歌曲《美丽的塔什库尔干》、刘副荣改编的笛子曲《帕米尔的春天》以及塔吉克族民间音乐素材改编的小提琴独奏曲。作品
目的 探讨急性心肌梗死患者的临床护理措施。方法 选取2014年2月-2014年10月间于我院治疗的40例急性心肌梗死患者,在对症治疗与常规护理的基础上给予心理护理、饮食护理、生
在量化分析欧美关税和非关税壁垒水平以及测算美国、欧盟和中国这三大经济体双边货物贸易比较优势的基础上,依据农产品关税、非农产品关税以及非关税壁垒水平削减情况设定不
<正>一、教学说明及教材编排意图"重叠问题"是人教版新教材三年级下册第八单元《数学广角》例1的教学内容。例1:借助学生熟悉的题材,渗透集合的有关思想,并利用直观图(韦恩
本文提出一种基于听觉掩蔽模型的语音增强算法.该算法对应用于语音编码中的听觉掩蔽模型进行了适当的修正,动态地确定每一帧语音信号各个关键频率段的听觉掩蔽阈值,有选择性
【正】 近年来,高等学校的写作教学出现了欣欣向荣的新局面。很多同志积极进行探索写作教学规律的试验,一部部写作教材相继问世,还有一些同志正致力于“文章学”(或“写作学