微服务系统故障检测算法的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:dimitrilyyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云服务的发展,用户的需求日益增多,微服务体系架构成为了当今企业解决单体应用模式的主要方案,其将一个大型的单一应用程序和服务划分为几十上百个微服务。微服务系统架构中的各个部分责任明确,调用关系复杂,故障发生时,准确定位故障服务节点有助于排查系统故障原因。由于微服务系统的故障通常是由于内存利用率、CPU利用率等关键性能指标发生异常导致的,因此想要对微服务系统的故障进行检测,需要在定位微服务系统发生故障的服务节点之后,对服务节点的关键指标进行检测和分析,找出导致系统故障的关键性能指标。针对上述微服务系统故障检测问题,本文提出了一种根据微服务系统调用链和微服务系统关键指标数据进行异常检测的算法。本文算法首先通过分析微服务系统的调用链数据,定位故障发生的服务节点,之后通过对故障服务节点的每一个关键指标进行异常检测,找到导致微服务系统发生故障的异常指标。本文的主要研究内容分为以下几个方面:(1)针对微服务系统进行了分析并将微服务系统的故障检测问题分解为两个关键子问题:微服务系统调用链中故障节点的定位问题,以及微服务系统中服务节点关键指标的异常检测问题。当微服务系统发生故障时进行异常检测时,首先需要获取故障发生前后微服务系统的调用链数据,根据调用链中每一个节点的调用时间进行分析,从而定位可能发生故障的服务节点。在得到异常服务节点后,需要对这些故障服务节点的关键指标进行异常检测,找出最可能发生异常的关键指标。(2)为微服务系统故障检测问题设计并实现故障检测框架,实现对微服务系统的故障检测任务。该框架主要包括调用链故障节点定位算法TAD和关键指标异常检测算法LVAE。其中TAD算法通过对微服务系统调用链数据分析和检测,实现对微服务系统故障节点的自动化定位,LVAE算法针对故障节点的每一个关键性能指标进行检测,并给出关键指标序列异常的概率从而找出导致系统发生故障的关键指标。最后通过两个算法的有序组合,完成对微服务系统的故障检测。(3)对本文给出的微服务系统故障检测算法进行对比实验并分析实验结果。本文主要通过i Forest、multi Dimesion、VAE等算法作为对比算法进行实验和分析,对比了每一个算法的精准率、召回率及F1-score。并使用了2020年国际Aiops挑战赛的数据集对微服务系统故障检测框架的异常检测能力进行了实验,证明了本文提出的微服务系统故障检测算法的有效性。
其他文献
光学遥感图像中的目标检测与细粒度识别,是指通过分析卫星或航空光学图像,确定目标空间位置,并将其细分到具体的子类别的一种技术。虽然,目前已经有一些工作尝试解决遥感图像目标检测问题,但仍存在着许多难点:(1)光学遥感图像中存在各种干扰因素,影响了检测性能。光学遥感图像具有背景复杂、环境多变的特点,带来了大量的无用特征,对目标特征的提取过程造成了严重干扰。其次,光学遥感图像中存在着许多密集排列的小目标,
学位
随着我国生产力水平的发展以及人口的日益增加,生活垃圾的数量不断增多,对城市的环境以及居民的生活健康都带来了不好的影响。针对此现状,2019年7月上海率先推行了严格的垃圾分类政策。同年9月,西安市也正式施行垃圾分类。但在国内许多数城市,将垃圾混装投放的现象依然大量存在,不利于对垃圾进行有效的分类处理。随着深度学习的发展,其在计算机视觉、图像识别分类上的应用也越来越多。因此,利用深度学习技术实现对垃圾
学位
高光谱图像作为遥感图像的一种,具有分辨率高,谱像合一等优势,被广泛应用于军事探查,农业研究,环境监测等领域。高光谱图像在每个像元上通常具有上百个波段,蕴含丰富的光谱信息,但是由于高光谱数据标注困难,每幅高光谱图像中只有少部分像元被标注,这导致验证算法的分类效果时只能在少量标注的数据中选择一部分用作训练,一部分用作验证,如今研究的趋势是使用少量的样本进行训练来得到好的分类效果。这时大量的波段信息会使
学位
图像超分辨能够将低分辨率图像重建为信息丰富的高分辨率图像,因此在卫星检测、生物医学、人脸识别和硬件安全等方面有着广泛的应用。然而,图像超分辨是一个病态问题,一张低分辨率图像往往对应于多张高分辨率图像,如何学习准确的映射关系并生成包含丰富信息的高分辨图像是超分辨任务的核心。本文以面向工程应用为目标,旨在控制模型参数量的同时提升超分辨性能。近年来,基于残差学习的超分辨模型在实验性能上有了很大的突破,残
学位
近年来,各行各业都在紧跟互联网行业的步伐,实现管理和销售渠道的电子化,由此就产生出了大量的软件和代码。市面上现有的代码管理平台或工具通常功能单一,没有一个平台对代码的整个生命周期进行统一的管理,因此实现这样一个综合性的代码管理平台是很有必要的。另外,根据代码产品可移植性高、可复用性高、开发效率高的特点,如果可以根据用户需求和代码产品特性推荐一个或多个组合的代码产品,那么就可以为开发人员提供已经编写
学位
高光谱图像同时提供物体的空间信息及丰富的光谱信息,利用光谱信息可以对物质进行材质识别,因此它在目标识别领域具有巨大的优势,这也使得它在地质勘测、物质分类等领域得到广泛研究。随着高光谱图像分辨率的不断提升,高光谱图像数据量越来越大,不仅对成像系统的存储造成了压力,而且给数据传输、处理都带来极大挑战。压缩感知作为一种新颖的采样理论,可在采样时对信号进行压缩,能够减少数据量,然而使用该采样理论对高光谱图
学位
第一部分基于常规实验室指标的血肿扩大生物预测标志物探索目的:脑出血是一种严重的脑血管病,致残率和致死率高。血肿扩大约在1/3的脑出血患者中出现,常伴随病情恶化,是脑出血不良预后强有力的预测因子。有效可靠的预测血肿扩大对尽早采取措施控制血肿扩大从而改善预后具有重要临床意义。基于常规实验室指标的生物预测标志物具有方便、快捷、经济、稳定、可行性高的优点。本研究的目的是基于常规实验室指标探索脑出血后血肿扩
学位
云计算技术的进步,使得云平台的种类朝着更加多样化的方向发展,产生了一些在网络环境、硬件架构等方面都具有显著不同的云平台。这些云平台通过混合部署方式构成了一种混合网络环境模式,使得云平台的环境变得更加复杂,进而导致云平台的监控和运维工作变得日益困难。传统的监控和运维平台可以完成基本的监控告警和半自动化运维工作,在一些实际场景中已经发挥了重要作用。由于这些监控运维平台不支持多云跨环境管理、多层次监控、
学位
生产制造业是国民经济的支柱性产业,我国工业生产制造逐渐向数字化转型,工业生产过程中会产生大量时间序列数据,对这些工业时序数据进行分析和挖掘可以有效保障生产安全、促进工业决策、提高生产效能。但是工业时序数据存在维度高、动态性强、噪声干扰多、非平稳的特点,导致现有时序挖掘方法失效。本文聚焦于工业时序数据挖掘中的多元时序预测及异常检测问题研究,旨在通过准确多元时序数据预测方法及有效多元时序数据异常检测方
学位
工业废水和生活污水等的直接排放严重危害人类生命安全以及生态环境的保护,对废水进行成分以及含量的检测具有重要意义。常用的对水体中重金属元素检测的方法大多需要对样品进行复杂的预处理,检测效率低,不能多元素同时分析,因此,亟需发展一种实时、原位、可以进行多元素分析的方法。激光诱导击穿光谱技术(Laser-induced breakdown spectroscopy,LIBS)是一种具有快速、实时、无需样
学位