论文部分内容阅读
随着网络技术和数据库技术的不断发展,企业不断进行信息化建设,各个部门根据各自的信息要求和特定的应用选择了各自的软硬件环境,从而使得部门之间不断的孤立,很难实现部门之间的数据共享。而现有的数据库厂商都提供一些数据集成工具,这些工具要么和各自的产品相关要么就是不具有通用性。目前,应用最广泛也是最成功的解决分布的、异构的和自治的数据库互操作问题的方案就是多数据库系统(MDBS)。MDBS在已有的一组局部数据库的基础上提供统一的访问界面,使得用户不用理会这些局部数据库之间的差别。本文主要针对关系型数据库进行设计,通过分析当前图书馆中所运行的一组学术论文数据库之间的异构差异,提出了一种MDBS解决方法。系统采用中间件体系结构。由于本文设计时主要考虑资源共享,并没有包括数据库系统中数据修改问题,所以在文中并没有分析数据一致性和事务相关问题。首先文中引入了一种基于数据视图的模式集成模型,并介绍XML语言模型描述方法。同时对查询执行过程中的一系列问题进行了分析。包括:查询预处理、查询分解、数据集成和管理、查询优化相关问题。查询预处理完成对全局查询语句的等价修改,包括查询整理、查询合并、等价条件变换,该步骤主要是辅助查询分解的执行,提高查询分解效率。查询分解完成全局查询的分解,局部数据库只能识别各自独立的查询表示方式,查询分解模块将全局查询分解为可在局部数据库上执行的局部查询,同时尽可能保证取回的数据是和全局查询相关的,该过程和模式集成信息密切相关,文中给出了一种建立在上述模式集成信息基础之上的查询分解算法,并在相应的章节中给出了详细的算法实现。数据集成过程和模式集成信息密切相关,完成局部数据片段的组装。查询优化章节中提出了一些提高全局查询执行效率的方法,针对图书馆中数据库存在数据复制的特殊情况文中给出了一种解决办法。最后,文中对系统的一些设计细节进行了描述,对系统整体设计进行了介绍。通过测试系统能够很好的解决模式冲突中提出的所有冲突,屏蔽了不同数据库体系之间的异构性和数据模式之间的异构,使得用户能够在统一的查询界面中完成数据的查询。