论文部分内容阅读
OLAP是近年来兴起的广泛应用于数据仓库中的一种多维分析技术,而ROLAP是其中应用最为普遍也最受关注的一种模式,目前市场上大多OLAP产品都基于此模式。ROLAP的实施所涉及的问题较多,底层数据的质量则是决定其是否成功的关键因素之一。目前,企业积累了大量的数据资源,但常常表现为地理上分布、管理上自治、模式上异构,必须进行先期清洗和标准化处理,以便为ROLAP引擎提供高质量的数据。尽管成型的OLAP提供了相关辅助工具,但都针对特定的数据源,应用局限性较大,价格昂贵。 本文的研究目的是在能够与目前主要ROLAP引擎产品兼容情况下,向下提供不同数据源的扩充接口,扩展异构数据源的处理能力;中间进行数据清洗和标准化处理;向上将OLAP引擎分析过的多维数据以可视化形式展现给客户端软件。 首先,本文详细分析了ROLAP的实现原理、元数据理论以及ETL工具的一般设计方法,提出了一种基于XML和元数据的ROLAP辅助工具的框架结构。在此框架结构中,以元数据为核心,采用XML语言描述,并以特定的DTD样式存储在元数据库中。应用时,利用SAX和DOM技术对DTD样式的元数据文档进行解析,得到所需元数据。这种框架可以方便开发人员对元数据库进行扩充和利用,使其专心设计相关工具所需的元数据及其样式。 其次,以上述框架为基础,具体给出了两个工具,即ETL辅助工具和多维数据可视化工具的设计与实现。考虑到目前产品在多用户并发控制上的效率和性能等问题,应用多线程技术给出了一个数据库连接池的设计方案,实现了高效的数据库动态连接和控制。 最后,基于SQL Server 2000数据库和MS Analysis Services对上述工具进行了相关的测试实验。结果表明所提出框架以及ETL工具设计的合理性,且多维数据可视化工具也较好地实现了多维数据的可视化显示及用户的交互。