论文部分内容阅读
语义Web是当前Web的延伸,它赋予Web资源机器可理解的语义,从而使计算机能够更好地与人协同工作。语义Web的核心是通过为Web资源添加能够被计算机理解的语义元数据,从而使整个Web成为一个通用的信息交换媒介。资源描述框架RDF及其模式RDF Schema(统称为RDF(S))是语义Web资源标注的推荐标准。RDF(S)在语义Web中发挥着至关重要的作用,有关RDF(S)的研究引起了人们的广泛关注。语义Web的实现很大程度上依赖于RDF(S)数据的管理,包括构建、存储以及查询等。从构建的角度来看,当前许多应用领域包含大量有价值的信息资源,为了使语义Web应用程序能够访问和处理领域信息并实现已有系统中信息的重用和共享,如何从已有的领域数据资源来构建RDF(S)成为了语义Web领域中的一个研究热点。从存储的角度来看,随着语义Web的发展,应用领域出现了越来越多规模庞大的RDF(S)数据,如何有效地存储进而使用这些资源已变得越来越重要。数据库是当今许多应用领域存储和管理数据资源的主要形式,因此利用数据库技术支持RDF(S)数据的存储也就成为语义Web领域一个重要的研究内容。从查询的角度来看,随着RDF(S)数据的大量涌现,如何有效地查询大规模RDF(S)数据集引起了越来越广泛的关注。当前大部分现有的RDF(S)管理工具(例如Jena和Sesame等)都采用关系数据库系统来管理RDF(S)数据,这样就可以利用关系数据库成熟的数据查询和优化技术来达到有效查询RDF(S)数据集的目的。但是应当注意到,RDF(S)的标准查询语言是SPARQL,而关系数据库的标准查询语言是SQL,因此,研究基于SPARQL到SQL查询转换的RDF(S)查询方法也成为了RDF(S)数据管理领域一个重要的研究问题。近年来国内外已有许多工作致力于RDF(S)数据管理相关的构建、存储和查询技术方面的研究。应当看到的是,现有的RDF(S)数据管理技术在现实应用中常常面临难以满足应用需要的挑战,对它们的完善和研究实际上一直都在进行着,如此才促进了它们的进步和发展。为此,本文深入系统地研究了RDF(S)数据管理相关的构建、存储和查询问题,提出了一个RDF(S)从构建到存储以及查询的完整框架,给出了具体的解决方案和实现方法。具体研究内容主要包括以下几个方面:(1)针对RDF(S)构建问题,提出了一种基于UML类图的RDF(S)完整构建方法。统一建模语言UML (Unified Modeling Language)已经成为了业界公认的建模标准,同时UML类图也被常用于数据库建模。因此,从已有UML数据源中抽取知识来构建RDF(S)成为了语义Web进行知识管理的重要手段。为此,本文首先给出了UML和RDF(S)的形式化定义;然后,通过深入比较和分析UML和RDF(S)的特点,提出了从UML到RDF(S)的构建方法,给出了详细的构建规则,提供了相应的构建实例,并对方法进行了分析和讨论;最后,基于提出的构建方法,实现了相应的自动构建原型系统,通过实验进一步验证了构建方法和原型系统的可行性。(2)针对RDF(S)存储问题,提出了一种基于关系数据库的RDF(S)多元存储模式。首先,通过深入分析RDF(S)数据和模式语义信息的特点,提出了RDF(S)在关系数据库中的总体存储框架;然后,给出了详细的存储规则以及存储算法,提供了相应的存储实例,并证明了存储方法的正确性;最后,基于提出的存储方法,实现了相应的自动存储原型系统,通过实验进一步验证了存储方法和原型系统的可行性,并与已有的方法进行了对比分析。(3)针对RDF(S)查询问题,提出了一种基于SPARQL到SQL查询转换的RDF(S)查询方法。首先,深入研究了RDF标准查询语言SPARQL的查询机制,重点研究了SPARQL图模式到SQL的查询转换,构建了基于图模式的SPARQL结构树,并对结构树进行先序遍历进而根据遍历节点内容的不同给出不同的转换算法;然后,在此基础上,提出了将SPARQL查询转换到SQL查询的方法;最后,根据提出的方法,建立了SPARQLtoSQL实验系统,对实验结果进行了分析,证明了实验系统的可行性、正确性以及有效性,并与已有方法进行了性能对比。