基于SPARK的电信4G网大数据网优平台的设计与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:akaiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,我们正处在大数据的信息时代,信息的爆炸式增长使得传统的技术架构无法满足海量数据的处理需求,大数据平台的研究与发展在这种环境下正当时。Spark是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、Machine Learning等大数据计算模型统一到一个技术堆栈,开发者使用一致的API操作Spark中的所有功能,使得Spark加速成为大数据处理中心首选的和唯一的计算平台。随着相关技术的逐渐成熟,很多公司都开始研究和学习spark技术,以满足自身业务的需求和提高产品的品质。在此背景下,公司提出基于spark系统在电信4G移动通信网络优化领域开展大数据网络优化平台的应用开发实践,传统的数据解析和分析方法和手段已经满足不了移动通信大数据时代对数据处理和分析的时效要求。该平台能够兼容Hadoop集群,同时高效的分析和处理海量数据,较传统方式性能提升有10倍以上。本人主要负责两个核心模块:数据解析模块和数据查询分析模块的设计与开发,包括设计数据解析模块的流程、编码实现数据解析、调优数据解析的效率、设计数据查询和分析的表字段、设计业务功能的SparkSQL的查询语句、优化查询性能。本论文主要介绍了本人利用spark技术在移动通信运营商的LTE网络通过处理海量MR测量数据辅助进行大数据网优的平台2个主要核心功能模块的建设。首先介绍了平台建设的背景和平台建设相关的技术,然后从功能性和非功能性需求两个方面分析了平台的功能需求。再次,详细介绍了2个核心功能模块:数据解析和数据查询分析模块的流程设计和代码实现、性能调优以及结果输出。最后,介绍了系统部署的过程以及与传统的方法运行的性能指标对比情况,从而验证了Spark在大数据处理上的出色表现,也证明本论文工作的有效性和实用性。该平台目前已经投入到公司日常的大数据处理工作当中,每月例行处理某省移动公司17个地市高达2.3T(压缩后)的网络优化相关数据。运行结果表明,平台的数据解析和查询分析模块能够正常运行而且性能表现卓越,可以满足某省一月完成一次全省规模数据的解析和指标输出要求,达到了预期目标。
其他文献
成都热水器销售旺季提前来临,市场价格越来越低,个个都在喊跳楼价,消费者花200多元就可以买一台5L的燃气热水器。面对如此低廉的热水器,你作何选择?前锋热水器提醒你,买热水器应首
你知道成都女性中意何种车吗?你对成都各年龄阶层所拥有汽车的情况了解么?……如果你想买车或者卖车,不能不看记者独家采访报道的成都女性车主探访录。
【目的】纯化获取卵形鲳鲹(Trachinotus ovatus)JAK3(TroJAK3)重组蛋白,为了解TroJAK3蛋白功能、相互作用及抗体制备奠定基础。【方法】应用分子生物学技术构建重组质粒pET-3
假冒、骗保、逃债、恶意透支……近年来,在我国市场经济交往与活动中,这类频频在新闻媒体上曝光的经济事件,构成了我国经济领域的一大景观。它警示国人:社会主义市场经济发展到今
硒是一种生物体必需的微量元素,纳米硒因具有低毒、高活性有望成为最佳的补硒形态。微生物转化合成纳米硒条件温和,纳米颗粒均匀,分散性好,结构稳定,在功能性产品开发方面应
清末民初孙中山的一批追随者探索社会主义(非科学社会主义)对孙中山产生一定的影响;他们的一些社会主义主张超出同时期孙中山的思想,并被孙中山以后所吸收,孙中山的社会主义
南充质监局自2001年8月新班子组建以来,在“班长”——局党组书记,局长费明的带领下,按照“注重建设,谋求发展,着眼提高,团结统一”的班子建设思路,狠抓自身建设。经过两年多的努力,
谷物类食品含有丰富的碳水化合物、脂肪、蛋白质、膳食纤维等营养成分,在我国居民的膳食结构中占有重要的地位。已有研究表明,对谷物进行适当的生物加工处理会显著提高其制品