【摘 要】
:
随着互联网的发展,分析处理海量数据成为各公司组织急待解决的问题。Hadoop分布式系统依靠廉价的PC集群提供可靠的并行计算服务,其子项目Pig立足Map-Reduce并行计算框架,提供
论文部分内容阅读
随着互联网的发展,分析处理海量数据成为各公司组织急待解决的问题。Hadoop分布式系统依靠廉价的PC集群提供可靠的并行计算服务,其子项目Pig立足Map-Reduce并行计算框架,提供类SQL功能的Pig Latin语言,成为实用、高效的海量数据处理平台。本文对Pig平台系统架构进行说明,介绍Pig平台引擎前端和引擎后端的功能,并结合实例阐述Pig平台处理Pig Latin脚本过程中产生逻辑计划、物理计划及Map-Reduce计划的具体流程。
其他文献
郑信是泰国历史上的一位华人国王,曾在阿瑜陀耶王朝(1350-1767年)末期带军驱缅救国,建立吞武里王朝,自立为王,后被部下即曼谷王朝(1782年至今)拉玛一世政变推翻。今天郑信的
游览名胜古迹,欣赏独特建筑,碧瓦朱甍、层楼叠榭、丹楹刻桷、雕栏玉砌、金铺屈曲、门当户对、五脊六兽、钩心斗角等美好景象和文化内涵,令人赞叹、难以忘怀,其中“门当户对”
本文对中学数学考试命题的有关理论进行了分析,提出了设计素质化中学数学考试试题的原则,同时给出了素质化中学数学试题的评估标准。
1998年5月和7月,作者在塔里木盆地东南部下突950夹次,捕获啮齿动物54只,隶属4科7属7种,捕获率为5.68%;其中包括大沙土鼠27只,证实在塔里木盆地东南部地区(38°56’N,87°55‘E)确有大沙
<正>自20世纪90年代开始,外科治疗理念就在逐步发生改变,最近,一种被称之为"快速康复外科"(fast track surgery,FTS)也称之为"术后促进康复的程序"(enhanced recovery
随着老龄化的不断加剧,我国已进入老龄化社会,老龄化带来的养老问题是影响社会稳定和我国经济发展所必须解决的问题。在当前家庭养老功能削弱、社会化养老功能欠缺的情况下,
20世纪末,信息技术突飞猛进。随着网络和通信技术的发展,电子商务在全球范围内也迅速发展起来。随着电子商务的发展和日趋成熟,电子商务影响并改变着社会经济、政治和生活的
城市化是经济增长和人类文明发展的助推器,已成为世界历史发展的一个不可逆转的趋势,它表现为人口向城市的集中、城市数量的增加、规模的扩大以及城市现代化水平的提高,是社
随着互联网的飞速发展,分析海量数据的需求变得十分迫切。针对分布式数据库昂贵及Map-Reduce计算框架中代码难以维护、重用等问题,雅虎研发了自己的海量数据分析平台Pig。Pig
本文有感于十八届四中全会《决定》中所提出的"坚持依法治国和以德治国相结合"的有关内容。本文分为三大部分:第一部分为法治,其中对法治的历史、法治的内涵及特征、法治的缺