论文部分内容阅读
传统的数据集成技术,已无法适应人们及时获取更多更新更全面数据的需要。因此,研究分布异构环境下多种数据源的集成成为重要问题。
我们课题组提出的多数据中间件模型恰是解决分布异构环境下多种数据源的集成问题的。该多数据库中间件是“建立在DBMS之上的DBMS”,在应用中通过对多数据库中间件的使用,使得用户可以透明地访问多个分布异构数据源(数据库系统或者文件系统等)。多数据库中间件采用Java语言实现,在功能上完成了源数据和目的数据之间的双向同步/异步更新,支持局部数据库系统动态加入或撤出,即局部数据源的即插即用。
本文首先分析了国内外分布异构数据源集成和互操作,多数据库技术的研究现状。接着介绍了我们课题组提出的多数据库中间件模型。该多数据库中间件模型由上推机(局部代理),集成机,SQL服务器等几部分组成。本文的重点是该多数据库中间件中的局部代理的设计与实现。
此外,本文也讨论了我们多数据库中间件系统中的数据双向同步更新机制。在论述这个内容时,首先分析了当前数据库更新技术的发展情况以及其不足之处,在此基础上提出了我们的异构数据双向同步更新机制。系统中,利用触发机制来实现数据的抽取、更新。
再次,在局部数据库数据的上推下拉实现问题上,提出了一种形式化的描述方法,描述上推需求,使异源数据呈现为一致的视图,从而使应用程序可使用传统的方法(如SQL、ODBC、JDBC等)访问异源数据,且体现异源环境下的数据上推的主动性自定义、需求和控制及过程的自定义性,以及上推事件定义、敏感定义、输出整合定义等问题。文中给出了数据上推描述语言的数据上推描述、数据库描述以及语法分析。