知识图谱中基于语义的查询算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:flybear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据量的爆发式增长,知识图谱的内容快速扩充,导致知识图谱的规模不断增加,查询难度也越来越大。现有的知识图谱查询算法大多是基于实体标签的子图同构查询,由于实体标签的片面性,不能准确地反应知识图谱的语义关系,导致查询结果的语义相关度不高。同时由于知识图谱的规模较大,现有的查询算法效率较低。针对上述问题,本文从知识图谱压缩和查询算法两方面进行了改进,具体工作如下。首先,提出了基于完全等价类的图压缩算法。针对大规模的知识图谱,通过比较节点本体信息和邻居节点判断节点是否属于相同的完全等价类,以此进行节点划分;然后判断多条边是否满足边的双向关系,进行边的压缩。通过图压缩算法,将知识图谱压缩为一个规模较小的知识图谱,更有利于查询与存储。其次,提出了基于节点相似度的知识图谱查询算法,采用“定位-过滤-查询”的策略进行查询。在定位阶段,根据查询图的全局和局部影响力选择中心节点,并根据此节点的候选集定位查询子区域,进一步减少知识图谱查询规模。在过滤阶段,综合考虑节点的语义相似度与结构相似度过滤节点候选集,提高候选集的语义相关度。在验证阶段,通过边标签同构验证候选集中的节点,生成结果集,并依据查询结果的语义相关度对结果集进行排序,输出语义相关度较高的前k个结果。最后,在Yago数据集和DBpedia数据集上进行实验,和已有的相关算法进行了对比验证。
其他文献
使用计算机模拟自然场景,一直是计算机图形学领域的重点研究课题。雾作为一种常见的自然现象,是图形学研究的重点之一。因为雾不仅与人们的生产生活密切相关,也被广泛应用于影视、游戏等领域,提高场景的真实感。由于雾的形态多变、光学特性复杂,所以真实模拟逼真的体积雾变得十分困难。针对目前雾效模拟方法真实感差,体积光照效果缺失的问题,在雾密度函数进行改进的基础上,提出一种基于单次散射的体积雾实时绘制算法,真实高
从网络角度出发,当前的软件系统不论是从规模还是复杂度来说,都在以惊人的速度急剧增长,由此而引发软件质量安全问题一直以来都是科研人员关注的重点问题,因此对软件网络的理解和度量、挖掘软件网络中可能被忽略的关键节点,对维护软件安全和对软件进行有效管理均具有重要意义。本文应用复杂网络理论对软件网络进行度量,识别关键性节点并对其排序,主要工作如下。首先,为了得到不同状态下的软件结构信息,分别对静态软件结构和
污水处理直接影响着民生民态,是各个国家面临的重大问题。青山绿水是我们国家一直坚持的生态目标,水处理也成为国家紧迫性的生态治理任务之一。水处理中的消毒环节可以去除或灭活我们日常用水中的致病微生物,从而防止水源性疾病的传播,因此对我们的日常用水非常重要。首先,本文阐述了本课题研究背景与意义,详细介绍了高压脉冲变换器的拓扑分类和国内外相关工业产品,并简要分析了高压脉冲变换器的应用领域,重点阐述其在水处理
汽车行业在经济发展进程发挥着重要的作用,但随着社会中汽车保有量的增加,尾气成为了城市空气的污染源之一。电动汽车因其环境友好的特点在节能减排和缓解城市污染方面发挥着重要作用。大规模电动汽车的无序充电行为会加剧电网波动,影响电网的安全稳定运行。本文通过研究智能电网与电动汽车间的交互关系,建立了电动汽车参与智能电网需求侧响应的充电负荷优化调度模型,在满足电动汽车充电需求的同时,通过合理规划充电负荷降低电
化石能源的储量缩减促使着太阳能、风能及氢能等可再生能源的发展,推动着含有可再生能源的微电网系统的研究。氢燃料电池因具有清洁高效、可搬运等优点在微电网系统中备受青睐,但其响应特性慢,在微电网系统中也会受到变换器传输效率的影响。为解决燃料电池在微电网系统中的特性问题,本文建立了基于部分功率变换的燃料电池/蓄电池联合供电系统并进行研究。首先,文中分析了燃料电池/蓄电池联合供电系统的结构。分析部分功率变换
相比硅基器件,GaN高临界电场使其具有低栅极电荷和低导通电阻特性,是其实现高效、高功率密度的主要因素,使GaN在诸如光伏、电动汽车等低于650V的高频应用中受到广泛关注。针对可应用于车载充电器(On Board Charger,OBC)系统中单级隔离型双向AC-DC变换器拓扑,文中结合GaN及其在该结构中应用的关键技术进行研究。针对单相图腾柱PFC与双向变换器构成的级联系统,通过桥臂复用,提出一种
随着智能监控设备技术的应用,3D增强现实虚拟场景技术的规模化普及和实施产生了大量系统性的空间数据,因此有效的数据查询处理技术成为了研究的重点。其中可视组k近邻查询与可视组反向k近邻查询研究成果重点应用于生物特征识别、网络游戏领域。现有的研究大多应用在二维空间,而且在三维空间中只是针对单一查询点,没有考虑多个查询点情况。但是在现实生活中存在许多对于多个位置的查询点可视组k近邻查询问题。例如多个不同位
随着大数据时代的到来,数据挖掘技术成为了当下炙手可热的研究对象,其中离群点挖掘技术作为数据挖掘领域中的重要组成部分,也得到了广泛的关注和探索。离群点挖掘技术依靠其独特的机制和有价值的信息在数据发展智能系统领域中发挥了重要作用。目前,离群点挖掘已广泛应用于欺诈挖掘、医疗诊断、公共安全等领域,国内外专家学者也提出了不少许多离群点挖掘的具体方法。本文针对高维数据集下,离群点挖掘表现出的局限性和不稳定性等
为了克服电力电子设备中输入电流畸变对电网造成的污染,功率因数校正技术已被大量使用。大部分整流设备由两级组成,前级进行功率因数校正,后级实现隔离与输出电压控制。这种方法需要大量器件,控制复杂,可靠性低。本文对Sepic整流器进行了详细的研究,Sepic变换器可以实现升降压输出,还有易于实现单级隔离的优点,同时具备功率因数校正功能,受到越来越多的关注。首先对连续和断续模式下的Sepic整流器进行了模态
随着化石能源的枯竭与环境问题的日益突出,以太阳能、风能为主的新能源发电得到快速发展。越来越多的分布式电源通过并网逆变器接入电网,导致电力系统的新能源渗透率不断提高。高渗透率系统不仅影响并网逆变器的稳定性,而且导致系统低惯量、弱阻尼的特性日益突出,使得系统抗扰动能力降低,严重影响了系统运行的稳定性。本文分别从弱电网下数字控制的LCL型并网逆变器特性、虚拟同步发电机特性和三相对称短路故障时短路电流特性