数据仓库中位图索引技术的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:feihuaxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库技术是数据库技术的一个研究方向,能够有效的管理传统数据库产生的历史数据,并向各种决策支持应用如联机分析处理、数据挖掘等提供有力的数据支持,适应了企业用户对数据深层次处理的需求。数据仓库是一个环境,而不是一件产品,提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。数据仓库技术是为了有效的把操作型数据集成到统一的环境中以提供决策型数据访问的各种技术和模块的总称。所做的一切都是为了让用户更快、更方便的查询所需要的信息,提供决策支持。数据仓库及其相关技术十年来成为研究和应用的热点。为提供有效的数据访问,大部分数据仓库系统支持索引结构。目前数据仓库中常用的索引结构主要有三种,B-树索引、R-树索引和位图索引。与B-树索引比较起来,位图索引只需要更少的存储空间,而且与B-树索引相比,位图索引将比较、连接和聚集都变成了位逻辑运算,大大减少了运行时间,从而得到性能上的极大的提升。但是很多属性维是分层次的,如时间维属性,分年、月和日三个层次。现存的位图索引往往是建立在某个单一层次上的,没有充分考虑维属性具有层次性这种语义特性,每次只能查询某一层次的记录,既浪费时间也很不方便;没有充分利用维层次特性对事实数据进行快速的分组聚集计算;也没有充分利用维层次编码前缀,来进一步提高分组聚集的操作效率。本文考虑充分利用维属性具有层次性这个特性对维成员进行编码,生成各个成员的维层次编码,用来代替维表中的原关键字,实现维关键字的压缩;通过这种比维表外关键字小得多的维层次编码来代替事实表中的维表外键,快速检索出与检索关键字相匹配的维层次编码,来求得所有维层次属性的查询范围;通过维层次编码及其前缀,可以将OLAP查询中大量的多表连接转换为在维上进行范围查询,大大减少和简化了事实表与维表之间的多表连接,利用维层次编码前缀和分组属性编码就可以直接对事实表中的记录进行分组聚集计算,将结果簇集存储到外存中,大大减少了I/O访问开销,从而提高了OLAP查询效率。
其他文献
网络拓扑发现技术是建立在网络拓扑结构、网络管理模型、网络协议以及网络发现工具之上的综合网络技术,是现代网络管理的重要部分之一。能否正确掌握网络的拓扑结构直接影响着
随着网络应用的蓬勃发展和网络规模的迅速扩大,基于IPv4协议的Internet逐渐显示出地址空间匮乏、缺乏QOS保证等弊端。IETF从1991年开始着手研究下一代IP网络协议——IPv6协议
随着计算机网络和多媒体技术的发展,动画、语音和视频等多媒体信息在因特网上变得越来越流行,基于计算机网络和多媒体技术的远程教育、视频会议和实时直播等信息服务得到了迅速
汽车工业的快速发展使城市交通拥挤问题日益突出。解决此问题的关键在于充分发挥交通信号协调控制的作用,以降低交叉路口平均延误,减少车辆平均停车次数,从而缓解城市交通压
从大型数据集中发现有趣的,有用的且预先未知的知识的过程被称为数据挖掘。数据挖掘又称数据库中的知识发现,是数据库研究最活跃的领域之一。通过数据挖掘可以从大型数据集中提
电子政务是信息化最重要的领域之一,而信息安全则是建设电子政务的基础。目前,我国电子政务内网的重要电子文档保护存在两大问题:一是重要电子文档一旦到达最终用户手中就失
CDN(Content Distribution Network)和P2P技术是目前Interent上实现内容传递的两种主流技术。内容分发网络的核心是将互联网内容提供商和电子商务应用站点的信息迅速有效地发
视频点播简称VOD,是Video On Demand的英文缩写,它是指用户可以在任何时刻从服务器(群)中获取所需的任意长度的音、视频数据到客户端播放的应用,是一种新颖的交互式多媒体服务。
学位
混沌是非线性动力学系统所特有的一种运动形式,它是产生于确定性系统,敏感依赖于初始条件的往复性稳态非周期运动,类似于随机振动而具有长期不可预测性,特别适合于保密通信领