数据集成方案中的元数据管理系统研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:qq345071009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据集成过程中,元数据为整个系统中的数据提供一张完整的数据地图。通过元数据,我们可以了解到系统中的数据结构、数据来源、数据去向以及系统中的一些业务处理规则等。在现有的元数据管理工具中,往往仅仅关注数据集成过程中的一部分,如ETL过程的元数据或数据仓库中的元数据。然而,在数据集成越来越复杂,数据越来越多的今天,如果仅仅对这些元数据进行管理是不能够满足当前对元数据管理的需求的。因此,我们有必要提出一种元数据管理框架。通过该框架,我们能够了解在整个数据集成过程中涉及到的数据源、ETL过程、数据目标的元数据,并且能够使这些元数据之间进行一定的交互。基于这种需求,本文提出了一种覆盖整个数据集成过程的元数据管理框架。它是一个以联邦式元数据库为基本思想,参考CWM元数据标准并结合高校数据集成中的共享数据库平台实际情况的元数据管理框架原型。可扩展性是元数据管理工具开发的重要需求之一。随着时间的推移,业务系统中的业务处理规则可能发生变化,对元数据查询的需求可能会增加。如何通过最简单的方式实现工具对这种变化需求的满足是工具开发中的难点之一。本文提出了一种动态关键字标识的方式来满足这种可扩展性。工具通过维护关键字和动态链接库的路径表来实现对元数据的动态需求。动态链接库与关键字相对应用以实现关键字所描述的功能。ETL过程是数据集成中的重要步骤之一,是一个以元数据为驱动实现数据的集成的过程。因此如何描述、存储和管理其中的元数据极为重要。本文将从逻辑上描述一个ETL过程,并给出一个简化的ETL元数据存储模型。在数据集成中,我们经常需要了解数据的来龙去脉,以增加数据可信度。我们以实例说明了本框架中如何实现一个数据谱系的追踪。
其他文献
互联网的普及和迅猛发展,传统的商业模式正经受着前所未有的冲击和影响,固定销售地点和销售时间的店铺式经营模式正日益被以信息流为主体的电子商务模式所取代。电子商务指的是
可重构计算技术是一个新兴的研究领域,是指在数字系统制造完成以后,其硬件结构可以根据需要重新配置的技术。可重构计算兼有通用处理器的灵活性和专用集成电路的高效率的双重
作为一种典型的攻击方式,缓冲区溢出攻击由于能够获取系统的最高控制权,危害巨大。为此,操作系统不断引入新的安全防护机制,如数据执行保护(DEP)和地址空间分布随机化(ASLR)
网上购书是利用现代化信息网络进行商务活动的一种重要手段之一,用户通过流览器登陆到系统进行在线购书,整个过程方便、快捷,与传统店面书店相比,网上购书的市场规模和经营模式突
随着多核技术的迅猛发展和多核处理器的迅速普及,计算机的并行处理能力日益增强。为了充分利用硬件效能,程序设计者已经把多线程程序设计作为主要编程范型。线程间同步以及线程
图像分类是计算机视觉研究的重要分支,其目的是根据图像包含的视觉信息,将图像划分到其所属的特定语义类别。图像分类研究能够实现对图像内容的自动理解,是实现图像语义内容自动
视频监控作为人类视觉的延伸,广泛应用于安全防范、公共场所的安全监控等。随着高速公路的迅速发展,人们对于高速公路的有效管理提出了更高的要求,为了顺应这一要求,视频监控技术
  IRL是当前嵌入式系统倡导的一种新的设计理念,其核心是通过Internet对远程设备的硬件进行升级、重构、调试和监控。IRL技术的出现,使远程升级和维护硬件成为可能,基于该技术
近年来,随着Web服务技术的广泛应用,互联网上出现了大量的Web服务,这些服务通过Web平台为消费者提供各种功能,构成了大规模面向服务计算的基础。由于服务开发者众多,具有相同
随着数字技术和Internet技术的不断发展,数字多媒体作品的应用已经达到了前所未有的深度和广度。例如视频点播、收费电视节目、以及视频会议等,这些应用对于多媒体数据的安全