CC-MRSJ:Hadoop平台下缓存敏感的星型联接算法

来源 :电信科学 | 被引量 : 0次 | 上传用户:houwplanling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种缓存敏感的MapReduce星型联接算法,事实表每列单独存储,维表根据维层次划分为多个列簇.事实表外键列与对应维表采用相关性存储,减少联接过程中的数据移动.算法分为两个阶段,首先每个外键列和对应维表进行联接;然后对中间结果进行联接,随机访问测度列,进而得到最终结果.算法只读取需要的数据,缓存利用率高,从而具有良好的缓存敏感特性;算法充分利用时延实体化,避免不必要的数据访问和移动.通过在SSB数据集上与Hive系统的对比测试表明,CC-MRSJ算法具有较高的执行效率.
其他文献
本文结合编辑实践,对文后参考文献中存在的名词术语问题进行了分析,提出了名词术语准确、规范表达的建议.
近年来,全球电信运营商纷纷采用云计算以实现对内IT系统及对外创新业务的转型。本文首先从电信运营商角度解析云计算的内涵及特征,然后提出了运营商云计算服务体系和技术体系架构建议。
肝豆状核变性(HLD)是一种常染色体隐性遗传病,主要累及神经系统及肝脏、肾脏等。尽管人们早已认识到铜代谢紊乱是HLD发生和发展的重要因素,但迄今为止对HLD患者产生铜代谢紊
目的:探讨红细胞平均体积(MCV)、平均红细胞血红蛋白量(MCH)、红细胞体积分布宽度(RDW)、红细胞脆性试验以及葡萄糖6磷酸脱氢酶(G6PD)活性检测在地中海贫血(THai)在地中海贫血诊断中的应
通过对SHA-3算法置换函数Keccak-f的线性性质以及缩减轮数的Keccak杂凑函数原象攻击的研究,提出了SHA-3算法的抗原象攻击性能优化设计方案.首先结合Keccak杂凑函数的差分特点
目的:通过检测并分析糖化血红蛋白(HbAlc)、空腹血糖(FPG)及餐后2h血糖(2h PG)对糖尿病诊断的特异度与灵敏度,探讨HbAlc对糖尿病的诊断价值。方法:收集在我院体检并发现FPG升高的研究
2010年1月25日,沃特世(NYSE:WAT)公司继六年前推出的具有卓越性能的UPLC之后,又推出新型的AOQUITY UPLC H-Class系统,该系统在拥有耐用、可靠的超高效液相色谱(UPLC)的同时,又具有与传
1 临床资料病例1 :患者,女,83岁,主因“咳嗽咳痰6天”以“肺部感染”,于2008年1月16日入院,患者6天前因着凉出现咳嗽、黄痰,伴发热、食欲下降、嗜睡。无反酸、烧心等症状,平素便秘,本
目的:探讨糖尿病合并冠心病患者的护理对策。方法:回顾性分析2008年5月~2010年5月本科住院的女性糖尿病合并冠心病患者50例,根据不同病情采取不同的护理,主要从控制血糖波动为主
重点论述了移动互联网环境下智能管道的网络架构和关键技术,指出"感知、控制、开放"的智能管道能力将成为运营商网络能力提升的主要技术发展方向,感知是智能管道的基础、控制是智能管道的核心、开放是智能管道差异化服务的主要手段。