融合多核和MapReduce的连接聚集查询优化

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:chimaomao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连接聚集查询是大规模数据分析的核心操作算子之一,多核处理器为大规模数据的连接聚集查询操作提供了优化空间但同时也存在很大挑战.主要针对多核处理器集群环境,研究MapReduce框架下大规模数据连接聚集查询的优化算法.首先,基于传统MapReduce框架设计并实现了Map端的单线程连接聚集查询算法,基于实验分析指出MapReduce和多核处理器融合提升性能的必要性;其次,针对处理器的多核架构,设计并实现了Map端的多线程连接聚集查询算法,找出了MapReduce和多核处理器融合的性能瓶颈;进而,提出了Map端
其他文献
航空航天工业正处于提高飞机性能的持续压力下,不管是商业飞机还是军用飞机,都要使它们具有更大的燃料效率并降低成本。一个关键的策略是只要可能就用更轻的材料替代金属,这些材
<正> 小肠结肠炎耶氏菌是一种常见的人类胃肠炎的致病因子,其能够分泌一种热稳定的肠毒素,此外,这种耶氏菌还有一种能穿过小肠粘膜并集中于派伊尔氏斑和肠系膜淋巴锗的特殊能
随着计算机科学技术的不断发展,计算机实验室已经成为高校教学的重要平台。文章以某高校为例,针对实验室维护与管理中存在的问题进行分析,导出对实验室有效管理,减少必要维护
大数据时代的来临为数据存储与管理提出了新的挑战.随着数据量的迅猛增加,自动数据分布逐渐成为分布式系统中的研究重点和难点.根据对数据分布问题中数据、负载和节点3个要素
文章介绍了一种超前支护液压支架的性能、特点及相关参数,研究其制造过程中的工艺及其步骤,并介绍了它的使用方法、使用效果和注意事项。
就像许多行业一样,中国在复合材料行业上也有较高的目标。金融危机已显示中国国内市场现在有能力保持增长,这给复合材料行业中的众多公司提供了额外的灵活性。中国复合材料市
期刊
本文结合自身工作经验在简单分析了企业在发展运营过程当中工会群监工作的重要性及其存在的问题的基础上重点探究了企业工会群监工作的改进办法,以供参考。