基于Storm的大数据实时处理架构的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:cdxwindows
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,对海量数据的挖掘使用越来越频繁。在实际场景中,往往需要对实时数据进行处理分析并及时反馈。起初很多企业为尽快响应业务需求,采用的方案是利用Redis的消息发布与订阅功能,结合List、Sorted Set、Hash的数据结构特性做处理,最后通过socket反馈。该方式强依赖共享内存,随着数据量级的飞跃,拼机器内存的做法显然不合适。由此,针对高并发、大数据、高实时的应用需求,本文设计并实现了符合现下场景的大数据实时处理架构。本文依托于实际业务场景中营销分析主题下广告分析、促销分析、优惠券分析三大子系统的功能需求。根据数据流向,本文将架构分为消息中间层(数据采集)、基础架构层(实时处理)、数据存储层、服务层和应用层五层结构。本文围绕五层结构开始技术选型,最终设计并实现了低耦合、高拓展、可复用的处理架构。首先,针对数据采集阶段,基于KAFKA构建消息队列实现缓存区,避免数据井喷式增长可能导致的数据滞后丢失等情况;其次,基于Storm构建流式处理框架,组成分布式数据处理网络,以解决传统消息队列控制复杂的问题;然后,结合数据特征与经济成本考虑,选用My SQL、HBase、Elastic Search实现多数据源组合存储;最后,为优化查询效率,基于Presto实现分布式SQL查询。本文研究的架构经过近一年的分析、设计、开发、调试、测试等多个环节的反复验证,从去年10月份开始,已逐步替换至线上环境使用且效果良好,充分证明其可用性、稳定性及高性能。
其他文献
面对生产数据的持续增长,数据中心对容灾的需求越来越高,如何更好更有效的保护数据是目前面临的一个难题,面对目前的现状需求一个更合适的容灾解决方案。
<正>案例:洪先生是某会计师事务所的会计师,与单位签订了为期3年的劳动合同,合同期限自2014年1月日至2016年12月31日。2016年11月,会计师事务所提前30日向洪先生发出了劳动合
<正>城镇职工基本医疗保险制度运行之初,考虑到部分慢性病门诊医疗费用较高,各统筹地区根据本地实际情况都制定了特殊病种门诊(以下称门诊慢病)治疗管理办法,将部分门诊慢病
目的观察醒脑通络七部法治疗脑卒中的疗效。方法 90例脑卒中患者,随机分为治疗组和对照组各45例,治疗组采用偏瘫康复七部法治疗,对照组采用传统针灸推拿理疗手法,进行疗效对
随着我国证券市场由政府主导型向市场主导型转变,人们的投资观念发生了根本性转变,一些本原性的、市场主导型的机制和制度正逐步形成。近年来,我国证券市场指数剧烈波动,证券
采用磷酸盐缓冲液提取法,研究了从茶鲜叶中提取多酚氧化酶的最佳工艺条件.结果表明,茶鲜叶多酚氧化酶提取的最佳工艺条件为pH 6.4,料液比(茶叶g∶缓冲液mL)为1∶1,离心转速为
<正>在高中阶段,英语是一项十分重要的科目,学生掌握好英语起到重要作用。词汇教学的质量与学生能够良好的学习英语有必然联系,为了完善词汇教学的各个环节,必须对教学方法进
笔者通过对《伤寒论》《金匮要略》中含有柴胡的方剂进行整理研究,得出仲景凡用柴胡,必与养阴药配伍使用。不管柴胡是否如后世所说的劫肝阴,柴胡与养阴药配伍,与病症更贴切,
<正>一、情境教学在地理课堂教学中的作用1.激发学生的学习兴趣地理学科被高中文科生评价为除数学外最难学的科目,从而使很多学生产生畏惧。如何提高学生的学习兴趣,成为地理