论文部分内容阅读
时间信息广泛存在于各种实际应用中,很多应用领域使用时态信息来描述有效的数据。随着Web技术的快速发展和海量Web数据的出现,支持Web数据语义表示与处理的RDF(Resource Description Framework)模型得到越来越广泛的应用。Web具有显著的动态性特点,经典的RDF模型只能表示Web数据的当前状态,不能追踪Web数据的历史过程以及预计数据的未来状态。为了能够准确地表示和处理Web上的RDF数据,研究者提出了时态RDF模型。当前,动态Web环境下RDF模型的广泛使用已经导致大规模时态RDF数据的出现,如何从海量时态RDF数据中快速获取所需要的语义信息就成为了实现时态RDF数据管理的重要问题,而时态RDF模型索引是解决这一问题的有效途径。针对当前缺少时态RDF模型有效索引机制的现状,本文致力于时态RDF模型索引方法的研究。在对经典RDF索引方法和时态RDF模型进行深入研究的基础上,根据时态RDF模型结构及语义方面的特点,提出两种不同的时态RDF索引机制,一方面为时态RDF模型建立有效索引进而实现高效查询提供解决方案,同时也为时态RDF索引的深入研究提供理论基础。本文的具体研究工作如下:(1)针对时态数据模型的事务时间和RDF模型的三元组表示法,提出时态RDF模型的三元组表示法以及面向时态RDF三元组的索引机制,给出索引的数据结构和构造算法,并通过实验对索引的性能及索引支持的查询效率进行了评估,总结出时态RDF三元组索引的应用场景以及适合的查询类型。(2)针对时态数据模型的有效时间和时态RDF模型的图表示法,提出时态RDF模型的图表示法以及面向图数据结构特征的时态RDF图索引机制,给出时态RDF图索引的数据结构和构建算法,并提供时态RDF图索引的维护方法。对于本文提出的时态RDF三元组索引和时态RDF图索引,通过实验比较两种索引性能及索引支持的查询效率,总结出两种索引适用的应用场景。