大规模RDF图数据的属性路径查询及推理研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:feier068
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性路径查询(Property Paths Query)是RDF图数据管理中的一种基本查询,由SPARQL1.1引入,并成为W3C的官方推荐标准。现有的属性路径查询方案均基于多重索引,经过多次迭代查询实现,效率低下,且不具备推理能力。由于开放链接数据运动(Linked Open Data,LOD)的开展,互联网上RDF数据呈现爆炸式增长,海量RDF三元组数据构成了一个巨大的图。在如此大规模的图数据上进行高效的属性路径查询,是一个有意义,且很具有挑战性的工作。本文主要做了两方面工作。首先,针对Property Paths不支持嵌套语法,无法表达部分RDFS(RDF Schema)语义的问题,实现了RDF-Plus原型系统。采用基于自动机的算法,隐式添加推理规则,将Property Paths转化为嵌套正则表达式,在不改变原有的时间复杂度的基础上,实现了对RDFS推理的支持,丰富了查询结果,提高了准确率和召回率。其次,针对随着数据量的爆炸式增长,单机的计算和存储能力无法满足计算需求的问题,结合Google近年提出的Pregel模型和其开源实现Giraph,设计了一种并行算法,通过一次消息扩散和一次回溯求解。算法不仅可以得到符合查询的所有结果,且可以把中间结果作为子图返回,查询结果直观且表达力强。综上所述,本文基于嵌套正则表达式和自动机理论提出的属性路径查询解决方案,可以结合RDFS语义进行推理,在保持原有的计算复杂度的同时,提供更全面的查询结果。基于Pregel模型将单机算法并行化,有效提高了系统的查询速度,使得同等数据规模下,查询时间和计算资源规模呈现明显负相关,具有很好的可扩展性。最后,通过大量的性能评估和对比实验,证明了本文提出的解决方案在大规模RDF图数据的属性路径查询方面,具备显著的性能优势和更好的用户体验。
其他文献
安全认证是确保网络系统正常运行和重要信息不被篡改或非法使用的基础。移动自组网中由于无认证中心可以管理认证密钥和进行身份认证,其安全认证可以采用基于门陷秘密共享方案
近年来,随着数字化技术的进步和互联网的迅速发展,数字媒体的应用越来越广泛。从九十年代初开始,以多媒体数据的版权保护和完整性认证为目标的数字水印技术和信息隐藏技术迅速成
本文是以煤炭企业ERP为研究对象,主要阐述了煤炭企业ERP系统的理论研究、开发技术与系统实现。 首先,阐述了ERP系统在国内外发展的现状,并介绍了其在煤炭企业中的应用情况。
基于内容的图像检索是当前多媒体技术和人工智能的热点课题之一,它直接对图像内容(如图像的颜色、形状、纹理、背景等)进行分析,并对图像特征进行合理的描述,使得检索过程更加有效
随着移动通信技术和移动硬件设备的迅速发展,人们在日常生活工作中对智能手机的依赖性越来越强,Android的市场占有率因此迅速增长。作为主流的移动端智能操作系统,Android允
针对当前用电稽查管理忽视业务流程的集成、平台实时性和扩展性较差等问题,本文采用消息发布/订阅模式解决过程数据集成问题的设计思想,提出了基于发布/订阅模式的用电稽查管
本文所阐述的GBuilder平台就是架构在网格支撑软件平台之上的用于快速实现网格应用的开发平台。该平台综合采用了代码生成、适配器和工作流等技术,以良好的用户界面和快捷、实
本论文选题来源于国家自然科学基金重点项目“未知环境中移动机器人导航控制的理论与方法研究”(项目号:60234030)与国家基础研究项目“多移动体协同技术的基础研究”(项目号:A
从等值线图自动绘制的发展历史及现状可以看出,断层等值线图是平面等值线图的一部分,含断层的等值线图的自动绘制技术发展缓慢,半手工绘制带断层的等值线图的现象还普遍存在。本
无线局域网WLAN的成熟和广泛应用,为无线节点移动漫游提供了可能。当移动节点在不同的网络间移动时,不能正常地接入Internet获得网络服务。目前,移动IP是公认最好的网络层解