论文部分内容阅读
在电信经营分析系统中,管理和访问大型数据集的复杂性已成为数据生产者和用户共同面临的突出问题,数据生产者需要有效的办法来组织、管理和维护海量数据。元数据作为描述数据的内容、质量、状况和其他特性的信息的作用已变得越来越重要,成为信息资源的有效管理和应用的重要手段。为了能快速、高效地对数据进行处理与分析,为用户提供决策支持,“云计算”开始被引入到经营分析系统的设计中。因此,在经营分析系统整体向云平台移植的同时,需要深入研究元数据管理系统的技术架构、功能实现和业务特征,以全面支持云计算平台。本课题的目标在于提出一个基于云计算平台的经分系统中的元数据管理系统,对元数据进行建模与分析,对基于云计算平台的经营分析系统的元数据进行统一管理。论文重点围绕以下四个方面进行了研究:1.云计算平台上元数据的采集与部署。经营分析系统的元数据可分为技术元数据、业务元数据与管理元数据。管理元数据与业务元数据多数来自上层应用,且格式不一;技术元数据分散于各个模块内部,存放于分布式文件系统上。本文研究对各种来源的元数据进行统一管理,并且在分布式文件系统上实现元数据的采集与部署。2.基于CWM标准的元数据的交互与建模。OMG于2001年颁布元数据标准CWM 1.0(Common Warehouse Metamodel Version 1.0)。CWM定义一个描述数据源、数据目的、转换、分析的元数据框架,以及定义建立和管理数据仓库的过程和操作。由于元数据来源的多样性,经营分析系统内部不同模块所使用的元数据也不尽相同。本文研究经营分析系统各模块元数据的标准化,并基于CWM建立元数据模型。3.元数据的维护与分析。元数据是描述数据的数据,其中蕴含了大量的数据信息,包括数据的属性、来源、走向、数据间的关系等等。对这些元数据进行分析,并将分析结果反馈给用户,可以使用户直观了解数据,为用户的商业或技术决策提供支持。4.元数据的可视化。元数据之间的关系隐含了大量信息,研究元数据之间的关系,元数据的结构与数据走向,需要以图形界面的形式展示给用户,便于管理人员、业务人员以及技术人员对元数据的形象理解。论文最后以实际开发的原型系统为工程实例,进一步验证上述模型及方案的正确性与可行性。