基于Kafka和Storm的实时日志流处理系统的设计与实现

来源 :贵州大学 | 被引量 : 14次 | 上传用户:qq12441483
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量数据的实时计算是大数据计算的重要组成部分,实时日志数据分析逐渐成为各大互联网公司的常规需求。日志流实时处理技术在个性化推荐、实时风控、用户兴趣预测等场景中得到了广泛的应用。体量庞大的日志数据中蕴含着巨大的价值,其效用的实时性越来越强,面对这样的场景和需求,传统的日志离线处理方式已经不再适用。与之相反,实时流数据处理技术专为对时延敏感的业务提供数据实时计算、分析服务。本文旨在设计并实现一套基于Kafka和Storm的实时日志流处理分析系统,以实现对日志数据的实时、高效处理。本系统结合日志流的特性,以满足互联网公司对日志数据实时处理的普遍需求为出发点,通过整合日志收集技术Flume、消息中间件技术Kafka、实时计算技术Storm、分布式缓存框架Tair等多项大数据技术,设计并实现了一套完全分布式、稳定性强、易扩展、高性能的实时日志流处理系统。系统解决了异源日志数据收集、日志数据实时分析、Storm中间计算结果储存、Storm与Kafka整合开发等问题,并对Kafka和Storm技术做了源代码优化,以解决双集群混合部署后的系统性能问题。本系统的开发与实现依托于国内某团购网站的在线广告业务,系统主要职责是对广告日志数据进行实时分析处理,并为依赖于广告日志数据的系统提供数据支持。
其他文献
仔猪早期断奶是指在人为干预下,使仔猪吃母乳的时间由30~35天,缩短为20~25天,条件较好的养猪场甚至可以将断奶时间提前到15~20天。仔猪早期断奶包括仔猪与母猪分离,仔猪转群以及日粮
随着国民经济的发展和人民生活水平的提高,涂料消费水平已成为一个国家经济发展水平的重要标志之一。作为世界上最大的涂料生产及消费国,中国涂料市场蕴藏着巨大的发展空间。
余秋雨依仗渊博的学识、丰厚的文化感悟力和艺术表现力写下的散文集《文化苦旅》,不但揭示了中国文化的巨大内涵,而且也为当代散文领域提供了崭新的范例。余秋雨以其卓越的创
<正> 性教育性教育起源于政府的这种意图:让人民认识到性传播疾病的危险。这是一个公共卫生和社会政策问题,所以这是卫生部的责任。教育部在传统上是藐视性教育的,因为他们认
随着国家体制改革的进一步深入,各地行政事业单位进行财务管理的重点已经转变成建立健全行政会计财务系统。会计财务部门掌握着经济管理的大部分数据,用计算机进行管理这些数
目的探讨胸腔镜手术治疗自发性气胸的临床疗效。方法回顾性分析2010年5月~2012年10月VATS治疗64例自发性气胸的临床资料,总结手术时间、出血量、引流量、并发症及住院时间等指
随着经济的发展,在交易实战中成长起来的新型消费者权利不断地拓宽着法律的认知视野。从对消费者深度人性关怀的角度,探讨消费者商品交易反悔权应该保持天然的合同自治性,还
采用线型低密度聚乙烯(LLDPE)和热塑性弹性体乙烯-辛烯共聚物(POE)对高密度聚乙烯(HDPE)薄膜进行改性,研究了 LLDPE 和 POE 对共混体系薄膜力学性能、加工性能的影响,探讨了
<正>党的十八届四中全会审议通过的《中共中央关于全面推进依法治国若干重大问题的决定》首次提出了我国要建立宪法宣誓制度,并明确要求:"凡经人大及其常委会选举或者决定任
随着现代社会节奏不断加快,工作与生活的压力也不断增加,人们的身心健康问题越来越受重视。数据显示,近些年来我国的精神病患者人数逐年上升,虽然精神病方面的医学技术也在不