论文部分内容阅读
本文给出了异构数据集成平台的设计,该平台基于增量集成框架,采用模式集成的方式,通过构建基于XML的公共数据模型,实现了数据的半智能化集成。平台中的集成功能由网格服务提供,能够分布式的执行集成任务。
模式集成是异构数据集成中的关键技术。模式集成主要思想是将多个在本地数据源模式上抽象的局部模式逻辑上统一成为一个一致的全局模式,屏蔽语法上和语义上的冲突。本文通过XML SCHEMA对本地数据源和全局输出进行建模,给出了一种基于领域字典的模式匹配的方法,自动实现了基数为1∶1的简单匹配,对于复杂匹配则使用人工辅助的方式。
为了实现基于网格环境的异构数据集成,资源访问服务器的核心采用网格数据访问集成中间件—OGSA-DAI,通过OGSA-DAI的部署以及扩展,使得平台能够分布处理数据集成任务。在此基础上,本文针对集成应用,给出了一种基于副本存储的元数据管理模型,有效的提高了资源和服务的查找效率。同时,在MDS的基础上构建了星形的注册架构,实现了服务资源的多级注册以及有效查询。
基于上述理论和研究成果,本文对原有的数据集成流程进行试验改进,通过对比分析,给出了改进后的集成流程的性能分析与评价。资源和服务共享