论文部分内容阅读
数据集成平台的作用是提供一个访问异构数据源的统一接口,使开发人员不必考虑数据模型的异构性、数据抽取、数据合成等问题。异构数据源集成问题是数据库领域的经典问题,随着XML技术的兴起,再次成为了该领域研究的一个热点。 XML作为一种数据格式描述的元语言标准,不断地被应用到各种不同领域的数据集成中去。XML的充足性、条理性、可扩展性和自描述性成为其作为数据模型描述语言的优势。 本文以水利领域数据现状和对数据集成的要求为基础,进行基于XML数据集成的研究,重点解决水利领域数据模式的异构问题和查询语言的转换问题。在分析比较已有数据集成方法和体系结构特征的基础上,设计了基于XML的水文数据集成平台框架,并对其中的关键技术进行研究。主要工作如下: 1.设计一个基于XML的水文数据集成平台框架:本文以典型的Mediator-Wrapper体系结构为平台框架结构,采用虚拟视图的方法,用XML描述局部数据源视图。这样隐藏了每个系统的局部特性,提高了平台的透明性。使用了功能强大的XML统一查询语言XQuery,采用基于标准接口用统一的方式查询XML全局和局部视图。而且,XML Schema模型的充足性简化了包装器的映射。 2.对关键技术的研究 1)模式集成:模式集成是实现数据集成的一个重要方面。在进行数据集成时必须解决数据的冲突问题,为用户提供一个统一的、集成的数据视图。本文在分析比较已有模式集成方法的基础上,结合XML作为数据模型描述语言的优势,将XML技术应用于模式集成,改进了已有模式集成方法,生成符合XML标准的全局模式和模式映射规则,为全局查询处理奠定了基础。 2)查询处理:分析查询处理过程,重点描述XQuery到SQL的映射方法及查询结果转换成XML的方法。 本文工作的意义在于解决了关系数据库的XML化问题,设计的平台框架提供统一查询异构数据源的服务,为在水利领域内部建立一个通用数据访问底层架构奠定基础。