基于Spark的大数据资源共享平台的设计与实现

来源 :北京交通大学 | 被引量 : 8次 | 上传用户:liuchun9876
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的兴起,电信运行商的用户激增,所拥有的用户数量达到了亿级。电信运营商一个部门的月使用数据量就达到了 PB级别,并且运营商内部越来越多的部门也发现了巨量数据所带来的应用价值。联通原有的Spark大数据平台仅为一项业务提供支撑,且各类操作必须通过命令行进行交互,对新的用户不是很友好,学习成本也相对较高,若使用人数增多还会带来资源管理混乱问题。为支持多个部门的大数据作业,需要将原有的Spark平台升级改造为多租户资源共享平台,因此确立了 Spark大数据共享平台项目的开发。作者在项目开发过程中首先参与了项目的可行性分析与需求分析,分析平台的各项需求,确立项目总体目标。根据平台需求将平台划分为数据仓库管理模块、计算任务管理模块、内存文件管理模块、平台监控模块以及用户管理模块。其次在概要设计中,作者依据平台需求分析设计了平台总体架构、执行流程及数据库表,并画出平台架构图、模块层次图及数据库实体联系图。在概要设计基础上进行平台详细设计,作者采用Spark计算引擎、Hive数据仓库、MySQL数据库、InfluxDB时序库及Akka工具包等设计并开发了平台各模块组件。针对数据仓库管理模块和计算任务管理模块资源消耗较大的特性,将模块设计为服务集群以提高服务的性能与扩展性。作者在设计集群时,调研了各类负载均衡算法,根据任务所需资源选用适当的算法实现任务的负载均衡。在数据仓库管理模块中,作者设计实现了分布式数据仓库连接池,将连接池的连接类型划分为长连接与短连接,在提升了数据仓库的连接速度的同时保证短SQL优先执行。在开发平台监控模块时,作者采用InfluxDB时序库存储各采集组件采集到的监控数据,以保证程序的响应速度。当监控模块监测到异常时会将信息发送至故障处理组件,组件根据异常类型做出不同处理,管理人员不必时刻关系平台的运行情况,当平台出现问题时会自动通知管理人员,降低了运维成本。经多租户升级优化后的平台给用户带来了极大的便利,用户可更专注于业务的逻辑实现。平台会根据用户需求分配使用的资源,直观的展现任务运行情况。新平台已经通过了功能性测试和非功能性测试达到了上线标准,等待部署上线。
其他文献
从认知语言学和文化的角度,研究汉英语言中"辣"味觉的概念隐喻。经过研究发现:汉语和英语两种语言在"辣"味觉隐喻方面存在共性和差异,从而反映了不同民族文化和思维模式的共
化工产业是社会发展中不可或缺的一部分,尤其是现代化工产业为人类社会提供了多种多样的产品,是我国国民经济发展中十分重要的、不可缺少的组成部分。相应地,环境保护,是正方
通过对德宏地区少数民族大学生民族认同现状的调查分析,认为德宏地区少数民族大学生总体表现出积极的民族认同,但也存在对本民族传统文化认识不足和民族认同观念弱化的倾向。这
提出了焊接接头预充氢拉伸法评价焊接接头氢致裂纹敏感性的新方法,以30Cr Mn Si Ni2钢TIG焊接接头为研究对象,对此方法进行了试验验证.结果表明,预充氢后的拉伸试样断裂位置
目的观察中药离子导入对患者全膝关节置换术(TKA)后疼痛和肿胀的影响。方法将120例TKA患者随机分为2组,对照组60例TKA术后应用常规治疗和护理方法,治疗组60例TKA术后予中药离
目的:比较临床上常用的两种口腔护理方法在经口气管插管患者口腔护理应用效果,找出经口气管插管患者确实有效的口腔护理方法。方法:将60例经口气管插管患者,随机分对照组和实
现在很多汽车在中央门锁和电动车窗的基础上加装汽车自动升降窗系统控制器,以此来避免原有系统的不足。本文介绍了长城C30车型加装自动升降窗系统的改装操作,并详细分析其工作
自党的“十八大”和十八届三中全会召开以来,思想政治教育学的教育内容也应不断更新,以体现其时代性。针对当前思想政治教育内容体系滞后、实效性差的状况,对思想政治教育的内容
克劳斯法是硫磺回收的经典工艺之一,其原理是通过硫化氢的不完全燃烧,以适量的空气促使生成硫磺和水;这种工艺可以有效地减少硫化氢的排放量,降低环境污染,同时回收硫磺,节约
基于SYSWELD软件,模拟了P91钢激光对接焊时的温度场和焊接残余应力,并探讨了固态相变产生的体积膨胀、屈服强度变化和相变塑性对焊接残余应力的影响.数值模拟结果表明,体积膨