【摘 要】
:
随着云计算时代的到来,大数据技术也迅速发展起来。由于大数据呈现体量巨大、种类繁多、处理速度快和价值密度低等特征,传统的数据存储、提取、转换和分析等技术并不适用,因
论文部分内容阅读
随着云计算时代的到来,大数据技术也迅速发展起来。由于大数据呈现体量巨大、种类繁多、处理速度快和价值密度低等特征,传统的数据存储、提取、转换和分析等技术并不适用,因此需要新的大数据应用技术的解决方案。近年来,对大数据技术的研究,在不同行业和多个领域里面蓬勃开展,赢得了产业界和学术界的高度关注,并引领我国未来的信息化浪潮。如今海量数据已经能够结合大数据存储、处理和分析技术的研究成果,挖掘出高质量的知识和信息。现阶段主流的大数据工具主要是围绕Hadoop分布式系统基础架构的多种开源组件,包括HDFS、YARN、Zookeeper等。使用这些组件构建的大数据分析平台,由数据接入、数据存储、并行计算和平台管理等部分组成,提供从数据采集到数据存储,再到数据分析和数据可视化等基本功能。其中数据分析功能是通过研究不同场景下的大数据特点,利用成熟的并行计算框架,开发出特定的分析应用,从而实现对大数据的并行化处理。本文在现有的大数据分析平台的基础上,提出了基于MapReduce的任务算子模型的设计和实现。模型利用Avro序列化框架的结构化优点,形成一个处理大数据分析需求的框架。框架解决了传统并行计算框架缺乏灵活的组合方式,导致重复编程和额外的应用维护成本,也无法针对结构化的数据源有效地进行优化的问题。使用任务算子框架进行大数据分析,能够降低编程复杂性和数据耦合性,同时提高模块复用性。用户根据实际需要,通过组合多种类型的任务算子,形成分析应用的执行流程,从而达到无需或者少量编程,高效分析以及快速构建应用等效果。
其他文献
<正> 大凡一件事有人开始做,就有人开始评。有文学创作发生,于是有文学批评;有翻译活动发生,翻译批评随之而来。汉末开始佛经翻译,便有三国时的支谦提出翻译要“因循本旨,不
教学团队建设是高校教学质量工程建设的重要内容,是提高教学质量的重要举措。基于课程的教学团队建设,可以使团队成员更好的进行课程内容的整合优化、课程结构体系的规划以及
随着各国频繁地对外文化交流,英语已经成为一种国际性语言,是世界上使用最广泛的语言。大学英语教学作为大学生的基础课程之一,主要目的是为了提高学生的外语交际能力,对于大
总结了近年来关于末端炔与亚胺及衍生物的不对称加成反应的研究进展,包括小分子均相催化体系与固载化的手性催化剂.其中小分子均相催化体系主要有:Pybox-铜、手性二胺-铜、Qu
在世界新军事变革的今天,面对未来信息化战争,装备保障面临着极大的机遇与挑战;针对信息化战争装备保障的特点,分析了信息化战争对装备保障的影响;结合我军装备保障的实际情
从国内外翻车机卸车系统的发展与存在问题阐述了我国翻车机卸车系统的发展方向及相关问题。
薪酬是现在大学生择业的重要标准之一,本文通过对泉州地区旅游管理专业的学生进行问卷调查和访谈,分析了他们的起薪点感知现状,影响感知的因素及起薪点感知对择业的影响等。
谈学生母语在汉语教学中的运用问题古丽尼萨·加玛勒一、问题的提出在一次汉语教学研讨会上,同行中有人说,教师用汉语提问、讲解学生肯定听不懂,其教学效果也不会好。他们主张课
中国草地面积广阔,自然资源丰富,准确评估草地资源既是合理开发和利用草地的基础,也对生态环境的保护具有重要意义.但是,关于中国草地面积、生产力和承载力等本底数据至今为
酰肼衍生物不仅是重要的有机合成结构单元,而且具有优良的生物及生理活性,该类化合物显示了广泛的应用和发展前景.综述了近年来含酰肼结构单元化合物在医药和农药方面的研究