基于分布式微服务全链路实时监控系统设计与实现

来源 :北京交通大学 | 被引量 : 7次 | 上传用户:zylgg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博消息箱全链路服务监控系统Message-Box-Tracing是一款用于发现故障的系统产品。全链路代表所有的系统服务,相互连接,传递数据而形成的网状布局。当分布式系统发展得越来越迅猛,单个的系统需要有多台独立功能模块的机器来支撑,甚至每个功能模块需要有多台同样的机器来维持其稳定性。当一个系统已经不再是单机,不能再以一台机器来维持其运作,取而代之的是多台物理机器共同维持一个系统的稳定运行。最原始的查找方式只能依靠人工,从表现的地方开始逐一排查,直到找到源头。在这种情况下,多少开发人员的时间和精力都被无谓地浪费在排查故障当中。为了改善这一现状,本人所在的部门决定开发出这款全链路监控产品,用机器代替人,排查系统链路当中发生故障的机器,以及发生故障的原因。本文主要研究关于这款全链路服务监控系统Message-Box-Tracing的整体设计与实现。这是一款用于监控并发现微博分布式服务系统故障的系统。开发人员、测试人员和运维人员都可以使用,共同排查分布式微服务中隐藏的故障,尽可能地减少查找故障带来的人力、物力,时间和精力的消耗,提高各类服务人员的工作效率。该系统的设计依据软件开发相关理论,从工程化的视角阐述系统的功能及构成。本文讨论的重点是为什么要制作这个系统且怎么做这个系统。文章由浅入深,逐步研究该工程带来的影响以及产生的意义。当业务发展到机器相互连结,信息交互错综复杂后,形成了复杂的信息全链路,每天都会产生TB级的数据,产生故障不易发现,因此需要制作一个用于全链路跟踪监控的服务发现故障,减少人力物力的成本。系统需求要满足不同的业务组件数据都能被捕获,需要针对不同组件构造捕获装置,需要承受每秒百万级别的数据流,需要近实时的数据查询。首先根据Google的论文Dapper设计了链路数据流的数据结构Span,根据业务的差异,封装业务客户端的探针。同时制作了服务端接收这些探针发送的链路信息并存储。最后再组装成每一条完整的链路数据进行展示。客户端是每个业务服务的探针,连接着其他节点,让这张虚拟的网可视化,通过探针和接收器,展现了服务的上下游依赖关系,前后联系。使得抽象的网络服务具备了可跟踪监控的依据。而服务端就像信号塔,收集着探针信号的行走轨迹,此时在什么位置,遇到了什么困难也一并了解,让故障问题暴露在监控画面,实时定位故障。
其他文献
目的:对经尿道前列腺电切术(TURP)后发生膀胱颈挛缩(BNC)的可能因素进行分析,探讨膀胱颈挛缩发生的真正原因。并探讨减少和预防该并发症的方法及该方法在预防BNC发生中的疗效
在声乐教学这个特殊的领域中,教师与学生这两大因素会直接影响“教”与“学”的关系,当今社会的种种因素也会映射出声乐教学中所存在的问题,并且会直接影响到“教”与“学”的关
翟永明被普遍认为是中国当代最优秀的女诗人。诗人于1984年完成了她的第一个大型组诗《女人》,诗歌以独特奇诡的语言风格和惊世骇俗的女性立场震撼了文坛。在这之后的创作中,诗
目的从母乳标本和健康新生儿粪便标本中筛选出具有耐酸、耐胆盐能力的乳酸杆菌,并通过体外实验对其进行降胆固醇,抑制病原菌,抗毒素和免疫调节能力的评价,以期获得具有良好益
构建服务型政府对政府行为目标提出了新要求,即:为公众提供优质高效的服务。当前,我国政府行为模式存在与此要求不相适应的问题,如政府行为主体规模庞大、目标错位、政府职能
不忘初心,方得始终;牢记使命,方能致远。初心凝成使命,使命承载初心。初心使命不是抽象模糊的,而是具体实在的行动,是在一个目标接一个目标的接续奋斗中实现的。守初心、担使命,既要
报纸
随着科学技术的发展和社会形态的变革,知识经济和学习型社会逐渐形成,知识和学习成为人类社会持续发展进步的核心。社会的变化,职业的变更和人员的流动迫使每个人都要成为学习者
党中央、国务院历来高度重视小城镇的改革发展。为进一步整合城镇化发展资源.深化乡镇行政管理体制改革.2010年.中央编办等6部委启动部署经济发达镇行政管理体制改革试点。江阴
21世纪以来,如何打造企业核心竞争力,全面提高公司业绩,实现可持续发展,越来越成为国内外大多数企业绩效管理的重要研究课题。本文从绩效管理的基础理论出发,结合三一重装的
高等教育是现代世界的“基础教育”,而高等教育投入不足是目前全球高等教育发展面临的一个突出问题。在增加政府投入的同时,众多国家无不选择了改革高等教育的投入体制,确立