面向多源知识图谱的样例查询研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:kitwe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着知识的爆炸式增加和不同领域知识图谱的推出,面向知识图谱的查询已成为近来搜索引擎领域的研究热点。然而,由于不同领域的知识图谱大多独立存在且所涵盖的知识有限,仅基于单个知识图谱的查询结果已经不能满足用户的查询需求。本文提出面向多个知识图谱的样例查询问题,通过候选结果融合以及相关性衡量方法的改进,在保证时间效率的基础上,提高查询结果的质量以及用户满意度。已有的研究工作大多都是面向单个知识图谱的查询,已有的图查询技术不能应用于多个图上的查询操作,而且已有的相关性衡量方法是基于传统数据图的,没有考虑知识与数据的差异性。针对这些问题,本文主要从以下三个部分开展研究:第一部分,研究面向多个知识图谱的样例查询处理模型。使用用户友好的关键字查询技术,首先结构化用户输入查询关键字作为查询样例。然后,在每个知识图谱上确定用户查询样例,使用子图同构的方法,根据查询样例在每个知识图谱上找到前K个高相关性的子图。最后,选取与查询样例不完全匹配的候选结果进行融合操作。算法通过查询系统集合不同知识图谱,避免了知识图谱的全局模式集成,且更具灵活性。通过实验验证了方法可保证查询效率且具有较高的可用性。第二部分,研究基于知识的查询结果相关性衡量方法。为了进一步确定用户查询意图,在已有的基于距离和结构的样例查询的结果相关性衡量方法基础上,本文加入了知识流行程度作为一个补充的相关性衡量因素。使用事件的发生时间作为衡量知识流行程度的标准,认为越近发生的事情,越是流行的知识。通过实验验证了改进的结果相关性衡量方法有效地提高了查询结果的质量和用户的满意程度。第三部分,研究基于分组标记的候选结果融合算法。面向多个知识图谱的样例查询中,满足查询需求的结果可能来自于单个知识图谱,也可能是多个知识图谱上的候选子结果的融合结果。为了解决候选结果融合时,由于候选结果过多而增加的时间代价问题,本文提出了优化算法,为候选结果按照特征分组标记,从而按组融合,减少了节点匹配代价,缩短了响应时间。通过实验验证本文提出方法可有效地提高查询效率。
其他文献
近年来,移动通信技术飞速发展,极大地便捷了人们的生活,但是传统的蜂窝系统以基站为中心的网络结构使得小区的覆盖范围和业务提供方式受到很大限制,阻碍了容量的进一步提升,
近年来基于稀疏表示思想和压缩感知理论的波达方向(DOA)估计算法得到了快速的发展,其相对于传统算法的优势使其成为DOA估计领域的一个热点问题。与传统DOA估计算法相比,利用
随着互联网的兴起与繁荣,人们的在线学习娱乐及交流变得非常便捷高效。计算机以及移动智能设备成为了人们工作和交流的主要工具之一。伴随着互联网电脑端及移动端用户数量的
随着经济的快速发展,市场的竞争剧烈程度前所未有,世界流通产业也发生了巨大的变化,原来以制造商为主导的供应链模式开始逐步转向以再制造商为主导的供应链模式。另一方面,传
随着互联网日益普及,网民们对流媒体网络通信的需求日益增加。传统的单播通讯模式需要在服务器和客户端之间建立独立的数据传输通道,同时,服务器也可以针对客户不同的请求发
纹理是物体表面的一种基本属性并且被广泛应用于图像分析中。纹理分析是对物体图像的纹理特征进行分析,提取重要的表面灰度信息的技术。纹理特征提取就是利用计算机算法对纹
面向Web应用的云资源自适应配置问题是一类重要的云平台资源管理问题,广泛存在于云供应商的服务场景。随着云规模的日益扩大,云资源有效地自适应配置将显著提高云服务提供商
随着三网融合不断推进,下一代网络地不断发展,媒体网络传输服务多样化,QoE随即带上了“全业务”的标签,满足用户业务体验质量(QoE)成为网络传输服务的最终目标。与此同时,基
目前,电动汽车的驱动系统通常使用PID算法进行控制。电动车的驱动系统是非线性系统,其控制难度较大。采用PID控制算法,其控制效果并不理想。出现的主要问题表现为动态响应慢,
传统的基于位置的服务应用(LBS)仅针对单独位置信息呈现,已经满足不了人们对社交网络日益增长的需求。当与一些朋友外出游玩,在与朋友走散的情况下,想与其他人会合会花费很长