质量驱动的数据仓库三层体系结构

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:taixiangle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库的数据质量是数据仓库的一个重要概念。在以往的文献研究文献中提供了一种GQM模型,即Goal-Question-Metric模型,它采用质量问题询问的方法来改进数据仓库的数据质量。而它不能适应,日益增多的数据源及越发复杂的异构数据。 本文先对以往的数据仓库体系和有关数据质量的理论进行回顾,继而提出一种的数据仓库三层体系结构。在此结构中融合数据质量的要素,提出对其数据质量进行改进的方法,满足于对数据仓库各层不同的质量要求,从而达到对DSS的有效支持。本文重点描述了这个结构及其对数据质量有效支持的机制——簇和转换代理。在多个异构数据源基础上按照数据质量的需要,和元数据的相关描述,形成多级簇的阶层图。在簇的形成过程中加入了转换代理机制,这种机制克服了GQM方法的缺陷。在代理机制中,加入了知识检索工具,它不但用于划分形成簇,而且有效的把异质数据归类。同时加入了用于质量测量的测量代理,用于数据优化的优化器和评价机制。经过这些若干步骤转化,初始数据源的数据转化为接近甚至达到用户质量目标的数据。最后,因为数据仓库有时间特性,本文还加入了数据演化的有关理论和方法。
其他文献
该文论述了虚拟博物馆三维室内浏览人机交互系统,这个系统可以使用户方便的参观浏览虚拟博物馆,了解展品的各种相关知识.该文详细表述了系统中交互任务部分的设计与实现,利用
Java 是一项日趋成熟的技术,它从作为一种基于浏览器的脚本编制工具的商业起源演进而来.随着Java应用的普及与学入,对于安全问题,已经受到了越来越多人的重视.该文对于上述Ja
现代工业产品研发过程中,对设计产品进行有限元仿真分析是验证产品有效性的重要手段之一。在产品模型进行有限元仿真分析前,通常需要对其进行细节特征抑制和降维等简化以提高后
本文给出一个数据可视化系统的设计与实现方法,系统实现的环境是由多台indigo2和indy工作站组成的机群系统和以美国Oak Ridge国家实验室和Tennessee大学开发的基于消息传递模
随着大数据时代的来临,互联网上的信息呈现出爆炸式增长,这给信息检索带来额外的成本与负担,为此人们从中清洗出知识并构建出知识库。目前已有的知识库,包括DBpedia,YAGO等,绝大部
在生成复杂模型,尤其是装配体模型的六面体网格时,经常会遇到各部分子六面体网格之间的接触面上拓扑不一致的情况,这会对后续有限元分析造成很大影响。大部分有限元计算无法直接
电子商务的快速发展,使得物流配送面临前所未有的机遇和挑战。分布性和异构性是电子商务环境下物流配送决策支持系统的主要特点。 J2EE平台定义了许多用来构建分布式的多层
随着物联网技术的普及和发展,智能家居行业迎来了前所未有的发展机遇。越来越多的家用设备可以连接到智能家居系统中,系统中的自动化规则种类和数目也随之上升。为了满足更多不
据统计,85%的信息系统中存在着与地理位置有关的信息,在这些信息中,既拥有地理信息、地理相关信息,又大量存在着以传统数据库表达的非地理相关信息。GIS(地理信息系统)是解决这些信
随着2008年比特币的问世,数字货币及其衍生应用开始迅猛发展。区块链作为数字货币的核心支撑技术也得到了极大重视,并迅速成为互联网金融的新型技术热点。特别是智能合约与区块