数据仓库数据质量评价研究及其应用

被引量 : 18次 | 上传用户:yy393342067
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库作为支持决策的数据基础和重要手段,近几年来得到了迅速地发展,并已成功地应用到制造业、零售业、金融服务、电信、运输等多个行业,显示出了其勃勃生机和强大的生命力。数据仓库的数掘质量是数据仓库中的一个重要概念,它也是高质量决策最为依赖的环节。因此数据质量是关系到数据仓库能否成功建立和良好运行的关键所在。 本文首先对以往有关数据质量的理论进行回顾,继而在已有的数据质量度量体系之上,提出了用质量维度对质量度量标准进行划分,建立了分层次的数据质量评价体系用以满足不同的用户对数据质量的需求。 其次,考虑到数据仓库的时间特性,加入了数据演化的理论,提出了质量因子的概念,对质量评价体系进行了优化。通过用于质量测量的测量代理和用于数掘优化的评价机制,初始数据源的数据逐渐转换为接近甚至达到用户质量目标的数据。 再次,本文对以往文献中的基于可扩展元数据库的数据仓库结构进行了改进,在此结构中融合了数据质量的要素,提出对其数据质量的改进方法,从而达到对决策的有效支持。本文重点描述了这个结构和基于它的数据质量评价体系。对于数据质量有效支持的机制—簇,按照数据质量的需要和元数据的相关描述,形成多级簇的阶层图。 最后,本文把提出的数据质量的方法,应用到了信息产业的企业信息管理当中,实现了对其数据的质量评价,建立了“质量驱动”的数据仓库系统,有效的提高了数据查询和使用效率。
其他文献
现今,建筑企业的规范管理意识正在不断提升,科学化的管理水平也在不断提高。绩效考核作为人力资源管理的核心环节,越来越受到建筑企业管理者的重视。这种人事决策的重要参考
从市场经济发展对人力资源管理的要求,以及建筑业人力资源管理的现状出发,阐述了激励机制对人力资源管理的核心作用。着重对建筑业人力资源管理进行了分析,指出建筑业在人力资源
电力远程监测技术是将数据采集、远程传输和智能化信息处理应用于电能供用与管理系统中的一项综合性新技术。它以自动抄表技术为核心,具有速度快、精度高、实时性好、可直接与
先在的楚巫文化的规约,近巫文学的传承,反右、文革的特定历史情境的激活,童年受巫风的熏陶,以及后来有意无意间的主观认同和“隐喻领悟”,在这几项因素的共同作用下,形成了残雪其人
家族企业作为一种企业组织形式早已在世界经济中广泛存在。中国的家族企业更是具有相当的普遍性。然而当前理论界对于家族企业的研究相对缺乏,已有的研究中更多的是将家族企业
幽门螺杆菌的分子生物学研究现状胡伏莲自从1983年Marshall和Warren报道从人胃粘膜活体标本中成功地分离出幽门螺杆菌(helicobacterpylori,Hp)以来,国内外学者对此进行了广泛深入的研究。近年来分子生物学技术初步显示了
跨国公司转移定价是为了优化资金配置、规避税负、规避东道国的各种管制、规避国际金融风险以及争夺、控制市场。我国之所以很少采取用此策略,其原因主要是存在对转移定价认
分岔隧道是一种新型隧道结构形式。以漆树槽分岔隧道为工程背景,进行了掘进爆破的围岩震动效应试验,通过不同掏槽结构下爆破震动作用隧道围岩衬砌质点振动速度的频谱分析与质
国内外有关森林植被对流域水沙过程的影响尚未得出统一的研究结论,已成为学术界长期争论的焦点问题之一。森林的空间异质性决定了森林水沙作用功能在不同的自然地理区域和不同
为了研究地震作用下预应力管桩的抗震性能和提高预应力管桩的延性设计水平,通过进行预应力管桩振动台试验,了解有限桩基形式下振动特性,建立预应力管桩振动分析数值模型,模拟