论文部分内容阅读
随着语义网和时态数据处理的快速发展,时态RDF(Resource Description Framework,资源描述框架)类型的数据大量涌入,但目前对于时态RDF数据模型的研究以及相关的存储方式研究很少。本文在以往时态RDF模型研究的基础之上,为实现数据到数据库的映射,提出了由时态RDF概念模型到时态数据库TimeDB的映射方案,最终实现了一个时态RDF数据存储系统。本文的主要研究工作如下:1.提出时态RDF数据存储系统框架并予以实现。分别就几种传统RDF存储方式在时态RDF数据存储上的应用展开讨论,进而提出了一种本体实例分别存储的方式。在存储算法方面,通过对两种算法的对比分析选择了广度优先存储算法。接着定义映射规则,提出了一个针对时态RDF数据的存储框架,并对系统中每部分的实现做了详细介绍。其中针对RDF数据存储中最重要的问题——RDF数据的一致性提出了一个推理算法,通过对三元组部分和时态标签部分的分别处理,最终实现了一个以时态数据库TimeDB(Time Database,一种时态数据库)为后端存储数据库的时态RDF数据存储系统——TRDF-Storage,并通过实验证明了存储方案的有效性。2.进一步对时态RDF数据存储系统进行优化。为提高存储系统查询效率,对时态RDF数据的时间标签建立了一个基于MBR(Minimal Bounding Rectangle,最小边界矩形)的索引结构——2T-tree。对于传统R树索引无法处理时态数据的问题,提出了一个将时间变元转换的方法,进而对2T-tree中两种不同时态RDF数据类型进行了处理。实验结果表明,建立索引后的存储系统要比优化前的存储系统在查询有效时间区间时更高效。