论文部分内容阅读
海量RDF数据的高效管理是语义网技术发展的关键部分,由于RDF数据模型的图特性,面对大规模RDF数据时,基于关系数据模型、对象数据模型等传统管理方式难以同时满足低数据冗余与高查询性能这两个要求。若以图方式管理RDF数据不仅可以避免RDF逻辑数据模型与物理数据模型之间的转换,而且可利用成熟的图算法优化RDF数据查询。因此本文设计了基于图数据库的海量RDF数据分布式存储的一个解决方案。论文首先介绍了当前各类RDF数据管理方式以及它们的优缺点,并论述了基于图数据模型的管理方式对当前大规模RDF数据的适用性。接着介绍了课题相关的基本理论知识。然后给出了本文所设计的基于图数据库的海量RDF数据分布式存储的总体系统架构,并详细介绍了系统中主要模块的设计细节与相关算法。最后在实验部分验证了基于图数据库的RDF数据管理方式其综合性能优于基于关系型数据库的管理方式,另外验证了系统所支持的分布式存储特性。论文主要有以下几个创新点:1)图数据库分布式存储扩展;2)基于图模型视角对RDF数据集进行分割;3)SPARQL查询语言到图查询语言的转换。