海量异构轨迹数据处理系统设计与优化

来源 :武汉邮电科学研究院 | 被引量 : 3次 | 上传用户：out000

【摘要】

：

大数据环境下,互联网及其它行业领域中时刻都在涌现出海量数据并快速增长,而海量异构轨迹数据作为一种具有巨大的科研、经济、社会等价值的数据,对其查询显得尤为重要,传统的

【作者】

：

谢小丽

【出处】

：

武汉邮电科学研究院

【发表日期】

：

2018年01期

【关键词】

：

海量数据 storm 处理系统负载均衡

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大数据环境下,互联网及其它行业领域中时刻都在涌现出海量数据并快速增长,而海量异构轨迹数据作为一种具有巨大的科研、经济、社会等价值的数据,对其查询显得尤为重要,传统的海量轨迹数据查询系统框架存在着数据量增大时无法满足用户实时查询的需求。本文提出了一种基于storm的海量异构轨迹数据实时处理系统设计方法,首先对原始海量异构轨迹数据进行清洗、轨迹压缩、数据归一化处理等一系列操作使其成为结构统一便于系统处理的价值数据,然后采用分布式实时计算系统storm平台对实时海量轨迹进行处理,利用kafka作为中间缓存,增加系统的吞吐量。但系统在查询的过程中会遇到节点资源分配不均衡和数据量过大超过系统处理上限时引起的宕机两类问题。针对storm默认调度机制引起的系统资源分配不均的问题,传统的基于slot低使用率优先策略的确能均匀的分配storm集群中各个节点的slot资源,但仍然会出现集群中节点CPU负载不均衡的问题,本文对传统的基于slot低使用率优先的策略进行了改进,在对集群中各个节点slot资源分配时不仅考虑其节点的slot使用率,还会考虑节点的CPU负载情况,解决了节点slot资源分配均匀但CPU负载不均衡的问题。对于集群中有新节点加入时,采用动态负载迁移算法将原集群中节点的负载迁移到新加入的节点上。针对特殊时期,轨迹数据增长过大超出系统处理上限的问题,设计了一种过载处理方法,将轨迹数据间断性的接入系统,使实时查询系统处理的数据量明显降低。通过具体业务数据对该系统进行性能测试,主要包含了引入传统基于slot低使用率优先策略的系统测试、引入改进后的slot低优先策略的系统测试、引入动态负载迁移算法的系统测试、引入过载处理方法的系统节点负载测试。最后测试结果表明基于storm的实时查询系统在不同场景所面临的负载均衡问题得到了有效的改善,系统的实时性得到了明显的提高,在数据量超出系统处理上限时,没有出现各节点过载,系统宕机的问题,能够满足海量轨迹数据的实时查询需求。

其他文献

腔镜辅助与完全腔镜甲状腺切除术治疗良性甲状腺结节的效果评价

目的分析腔镜辅助与完全腔镜甲状腺切除术治疗良性甲状腺结节的效果。方法选取2013年12月至2014年12月到我院进行良性甲状腺结节治疗患者60例,随机进行分组,其中对照组为30例

期刊

腔镜辅助完全腔镜甲状腺切除术效果评价

异构数据库同步系统设计与应用

随着计算机和信息技术的发展,在诸多领域中以手工纸质为主要手段的传统数据记录方式正逐渐被信息化系统所取代。所有的信息化系统在数据采集后都会统一存储在各自计算机数据

学位

异构数据库同步XML数据捕捉数据载入

针灸治疗重症肌无力型上胞下垂55例

目的:观察针刺与艾灸联合方法治疗重症肌无力型上胞下垂的临床疗效。方法:55例进行针灸治疗,10天为一疗程,治疗3个疗程后观察临床疗效。结果:痊愈48例,好转7例,无效0例,总有

期刊

上胞下垂针刺艾灸

硬膜外隙预注小剂量吗啡超前镇痛对高龄患者术后认知功能的影响

目的观察术前硬膜外隙预注小剂量吗啡超前镇痛对高龄患者术后认知功能的影响。方法选择在硬膜外麻醉下行单侧人工全髋关节置换术且麻醉效果确切的的高龄患者84例,随机均分为A

期刊

硬膜外麻醉吗啡超前镇痛高龄患者术后认知功能Epidural anesthesia Morphine Preemptive analgesia Elde

《中国通史》复习指要

1.本课程的考核对象是小学教育专业的学生。2.本课程复习指要是依据《中国通史》(上)、(下)教材编写的,是考试命题的基本依据。教材使用林丙义主编,高等教育出版社出版的《中

期刊

《中国通史》历史意义抗日民族统一战线主要内容三国两晋南北朝小学教育专业失败原因洋务运动内容及意义明末农民战争

盆底肌功能训练预防和治疗产后尿失禁的临床观察

目的探讨产后进行盆底肌肉锻炼(PFMT)对产后压力性尿失禁的影响。方法将192例住院自然分娩初产妇,随机分为观察组和对照组。对照组实施常规产后健康教育指导,观察组由专业助

期刊

盆底肌肉锻炼产后压力性尿失禁影响

海量异构轨迹数据处理系统设计与优化

其他学术论文