论文部分内容阅读
随着企业规模的不断扩大,企业信息系统的规模也随之扩大,由于实施数据管理系统的阶段性、技术性以及其它因素的影响,以至于即使在一个单独企业,每个部门或单位就是一个数据源,每个数据源都可能是异构的,它们构成了企业的异构数据源。 不仅如此,网络的发展使企业逐渐从一个孤立节点发展成为不断与外部网络交换信息和进行商务事务的实体,企业数据集成也从企业内部集成走向了企业间集成。现在的企业比以往任何时候都需要将内部数据进行发布和交换,这必然导致越来越多的企业应用需要访问各种异构数据源,为了满足这种需求,必须有一种系统能够支持异构数据源的数据集成。 本文首先讨论了结构化的异构数据库集成时所面临的问题、集成的策略以及所用的技术,在此基础上提出了一个解决包括半结构化数据在内的异构数据源集成的总体解决方案,并实现了该系统的核心子系统——转换子系统。由于XML语言的灵活性和扩展性使其可以对不同应用甚至是差异很大的应用间的数据进行描述,因此该集成系统采用XML模型作为公共模型,将各种异构数据源都转换为XML文档来进行交换。