【摘 要】
:
随着云计算的发展,如何保证云平台的高效性与可靠性越来越受到企业的关注。运维是云计算业务平台管理中一项非常重要的工作,运维旨在保证云平台的高效性与可用性,传统运维存在系统复杂、维护难度高、风险压力大等问题,而智能运维AIOps(Artificial Intelligence for Operations)是用机器学习的方式辅助传统运维,极大提高传统运维的效率。本文对智能运维的异常点检测方向进行研究,
论文部分内容阅读
随着云计算的发展,如何保证云平台的高效性与可靠性越来越受到企业的关注。运维是云计算业务平台管理中一项非常重要的工作,运维旨在保证云平台的高效性与可用性,传统运维存在系统复杂、维护难度高、风险压力大等问题,而智能运维AIOps(Artificial Intelligence for Operations)是用机器学习的方式辅助传统运维,极大提高传统运维的效率。本文对智能运维的异常点检测方向进行研究,检测的对象为云平台下的监控序列,格式为(时间,监控数值)。传统的异常点检测有基于阈值的检测方法、基于距离的检测方法等,但传统的异常点检测方法存在漏报率、误报率高的问题,针对这些不足,论文做了如下工作:(1)设计了一个基于集成学习的异常点检测系统,整个系统分为离线训练与在线检测。离线训练通过监控序列聚类、监控序列预处理、特征工程、异常点检测器训练等构建出异常点检测模型;在线检测对监控序列归类后,使用相应的异常点检测器检测异常点,并将错分、漏分样本反馈给离线阶段重新训练,整个流程形成闭环,让异常点检测系统逐渐达到稳定。(2)构造监控序列相似矩阵,采用自组织映射神经网络对监控序列聚类,解决了异常检测对象多样性的问题;从数据层面、模型层面一定程度上解决数据不均衡问题。在运维过程中,异常点极少发生,导致了异常样本与正常样本严重不均衡,直接使用原始监控序列进行离线训练会导致异常点检测器偏好于正常这一类,导致漏报。论文对监控序列进行过采样,并且调整异常点检测器的损失函数权重,一定程度上解决了数据不均衡问题,对于检测结果有大幅度的提升。(3)对低方差的异常点检测器与低偏差的异常点检测器进行融合,有效的提高了检测效果。论文使用带有正常与异常标注的监控序列对异常点检测系统进行检测,结果表明:(1)在监控序列处理阶段,过采样对检测结果的提升影响最大。(2)在异常点检测器构建阶段,检测器融合对检测结果的提升影响最大。(3)参数优化对检测结果的提升有一定的帮助。
其他文献
本文阐述了当前我国城市储气调峰背景,肯定了储气调峰的重要性,列举了储气调峰有关政策和实施方式,指出了储气调峰存在的问题,提出了一些合理化建议,对我国储气调峰工作有一
概述电厂热工自动化系统的优点,分析在检修电厂热工自动化系统时出现的问题,详细阐述针对热工自动化系统各种问题的具体处理措施,希望可以为相关单位和个人提供有用的参考。
异质性及能源反弹效应冲击是能源效率决定机制及其演化过程中不可忽视的问题。针对现有文献的不足,本文采用时空加权回归模型对中国30个省区在1995~2011年间各时空点上能源效
随着新的就业形势的出现,高校毕业生就业的状况堪忧,由此也引发了大学生就业的有关心理问题。本文就造成大学生就业的心理问题进行了因素分析并指出了相应对策。
<正> 结合能和平均结合能的概念是比较抽象的,高中物理甲种本教材中对此的解释比试用本教材详细、具体,这体现了新教材中对这一部分内容的教学要求略有提高。原子核的结合能
在线学习的发展离不开规范的技术标准,但是早期的SCORM(Sharable Content Object Reference Model,可共享内容对象参考模型)技术标准已经不能适应目前的学习需求,而x API(Experi
目前,民间融资日趋活跃,已经成为一种普遍存在的经济现象。它在发挥推动经济发展、优化资源配置、补充正规金融机构等正面效应的同时,也带来了引发道德风险、干扰金融秩序、
目的探讨腹腔镜脾切除术的手术技巧、影响因素及效果。方法回顾性分析本院2003年8月至2008年9月65例腹腔镜脾切除术的临床资料。结果65例中63例顺利完成腹腔镜脾切除术,2例腹
在公司管理中,销售计划审批是根据销售合同、客户货款、计划审批等销售计划进行的销售工作,销售审批工作的好坏直接影响到公司销售任务的完成。基于此,本文对提高销售计划审
女大学生作为社会中的一个特殊群体,在就业中面临着众多特殊问题。针对现实中存在着的女大学生就业问题,从心理路径进行解读并找到克服对篆有着重要的理论价值和较强的现实意义