论文部分内容阅读
随着信息化的加速,许多企业纷纷建立了自己的信息系统。但是由于部门之间的具体业务与职能分工的不同,各个部门都根据各自的业务需求、数据信息和计算机软硬件环境状况,搭建了不同的信息系统平台。这就造成了数据信息类型的不统一,其中就包括了传统数据库系统中的数据信息以及其他系统中大量的结构化、半结构化数据。企业在国际贸易领域中,还将涉及到电子贸易单证数据,比如符合EDIFACT标准的报文数据以及ebXML标准报文等。数据格式的异构就造成了企业内部和企业之间数据交换的众多问题,所以为企业提供一个平台,该平台通过统一的查询模式屏蔽底层数据异构所造成的不便,方便快捷的实现数据查询和数据交换,提升企业工作效率,逐渐成为一个迫切需要解决的难题。本文分析了在异构数据集成领域中已有的若干解决方案,在对XML技术和数据映射理论的研究基础上,设计了一个基于统一虚拟视图的异构数据源集成引擎系统架构。本文提出了统一虚拟视图的概念模型,这是一种基于XML格式规范的数据文档模型,在文档模型中定义了数据源请求、参数替换、处理规则等元数据信息。文档模型中的脚本元素不仅可以描述客户端发出的数据源请求信息,同时还可以定义数据处理的流程和结果的返回方式,最终实现数据集成和数据转换的功能。具体研究设计了HDDocument、HDComponent和HDDriver这三种统一虚拟视图文档模型,由它们共同定义出数据的处理流程和相关配置信息。文中所设计的异构数据源集成引擎系统由几个模块构成,主要作用是实现了对统一虚拟视图文档中的脚本进行语义解析和数据传输相关功能。异构数据源集成引擎的系统架构主要包括了连接器模块、指令解析器模块和数据源适配器模块这几个主要功能模块,其中连接器负责提供对网络请求的数据信息传输支持,指令解析器具体负责脚本元素的解析,通过适配器模块与底层的异构数据源进行无缝连接,然后把结果通过集成的文档视图形式返回给用户。本文在最后对异构数据源集成引擎做了相关应用案例的测试工作,同时对系统的研究设计做出了总结,并且提出了今后将要进一步完善的工作。