论文部分内容阅读
随着计算机网络技术和数据库技术的发展,人们越来越迫切地需要共享分布在不同地理位置上的诸多数据库信息。网格数据库访问与集成对于在网格环境下实现各种数据资源的访问与共享扮演者重要的角色,在科学计算领域和商业应用领域也越来越受到重视。基于OGSA-DAI体系结构的一系列研究和方法较好的解决了传统数据网格应用中的异构信息集成问题,但是语义异构是数据集成过程需要解决的另一个重要问题,面向语义的数据集成方法将成为未来数据集成技术的研究重点。因此研究网格数据库面向语义的集成方法具有重要的意义。语义网技术的出现,使计算机能够从语义层面“理解”数据的含义,并在“理解”的基础上更好地处理和利用数据和信息。本体通过对概念的严格定义和概念之间的关系来确定概念精确含义,表示共同认可的、可共享的知识,从而解决数据集成中的语义异构问题。本文在网格数据库集成研究的基础之上,深入研究了网格应用环境中异构数据库基于本体的语义集成问题,从几个角度和侧面对相关问题进行了研究,提出了科学可行的解决方案。本文的主要内容包括:(1)对国内外基于本体的语义数据集成的理论基础和关键技术以及相关工作和文献进行了分析和研究:分析语义Web和本体的发展、应用现状和前景;阐述了本体的作用以及本体描述方法及演变;提出了基于本体的数据集成方法;讨论了数据库信息集成中的语义处理技术,引出了语义以及语义强度的分布等概念;对数据语义集成的研究现状和应用情况做了探讨和分析;指出了结合模糊理论进行数据语义集成的可行性。(2)根据本体提供的语义信息进行推理,使用户的查询具有一定的智能性,对比传统的数据集成方法有更大的优势,利用本体所提供的丰富的语义表达能力,提出了基于本体的数据集成机制的总体思想。为避免现有的XML的缺陷提出了一种利用本体作为全局模式集成XML数据源的方法,同时结合XML灵活强大的数据描述能力,为基于数据网格的应用提供了一种有效的数据集成方式。(3)分析了关系模式下数据库的基本查询操作以及实现语义查询的原理和方法,研究普通关系到模糊关系的扩展,并将模糊OWL本体应用于数据库的模糊语义查询变换,描述了由SPARQL查询及其组合来替代传统SQL关系数据库模式查询的步骤和过程。证明了SPARQL查询可以替代关系代数中的五个基本查询操作,并能得到预期的结果,从而为关系数据库的语义查询提供了技术手段。说明了SPARQL查询在关系上是完备的,可以模拟任何由上述五个基本关系代数运算组合而成语义关系查询。(4)数据集成技术由静态集成和紧密集成向动态集成和松散耦合集成已成为当前的发展趋势,Web服务具有自治、动态、松散耦合等特点,研究将Web服务应用于数据语义集成,提出了一个基于Web服务的数据语义集成系统模型,采用层次化的系统结构设计,系统主要由三个层次组成,分别是表现层,功能服务层和存储层,该系统具备动态性、松耦合的特点,有较强的实用性和灵活性。本体映射是语义集成的前提和基础,可以消除本体的异构特性,结合Web服务的特点提出了基于Web服务的本体映射方法。依据Jena推理机模型的原理,设计了一个本体推理子系统。(5)基于上述的研究内容,结合一个具体的校园信息化建设应用案例,提出了一种基于数据库及模糊语义的数字校园集成设计方案。提出了基于服务云架构的数字校园信息平台总体规划,设计了基于数据库的数字校园语义集成框架,针对设计方案中各个业务应用的数据查询请求,给出了模糊本体的创建、存储与管理策略以及模糊语义查询的处理方案,以满足应用对查全率和查准率要求。