论文部分内容阅读
数据,是当前计算机和网络技术应用的核心所在。但是,由于各种各样的原因,数据往往以不同的形式存储在不同的系统中,呈分布异构状态。近些年来,越来越多的用户迫切地希望能够透明地访问这些来自于分布异构系统中的数据,并能以一个统一的视图进行展现。
随着XML标准及其查询语言的不断发展和完善,越来越多的数据集成工具都在多数据库系统或者联邦数据库系统的基础上结合XML,提出各自的面向结构化结构和半结构化数据的查询接口与标准。然而,这些数据集成工具一直没有得到实际的应用。究其原因,在于没有统一的查询接口和标准。
本文提出分布式异构数据虚拟视图系统(DHVVS)作为一个中间件系统,是构建在异构的数据源系统之上,数据应用之下的。它负责各个异构数据库源的数据查询与访问,管理自身的数据缓冲区系统,以及对外提供标准的SQL接口。正是由于DHVVS对外提供了标准的SQL语言接口,使得旧有系统迁移到DHVVS之上,无需做成任何改动,即可做到无缝的集成。另一方面,开发人员可以使用自己熟悉的标准的SQL语言开发应用系统,无需去学习一种新的查询语言,大概提高了开发的效率。
本文首先分析了国内外分布异构数据源集成和互操作,以及多数据库技术和分布式应用中数据缓冲区的研究现状,给出了分布式异构数据虚拟视图系统的整体架构与流程。
其次,重点讨论了分布式异构数据虚拟视图系统中的缓存数据更新算法。这里详细阐述了分布式异构数据虚拟视图中的缓存替换算法、缓存更新算法、数据源中增量数据的捕获、合并等功能的实现。
再次,给出了分布式异构数据虚拟视图系统中实现的关键技术,包括扩展SQL语言、表连接算法、JDBC驱动、配置服务器、以及用户权限管理的实现。
最后,本文对课题研究成果进行了总结并提出下一步工作的思路。