基于Elastic Stack的服务日志分析系统设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ljh163com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,随着社会信息化的发展,互联网应用服务已经深入到人们生活的方方面面。互联网服务提供商们面临用户对互联网应用服务的体验要求越来越高的挑战。在互联网服务提供过程中,各项服务业务随时可能会遇到各种各样的问题,这些问题的出现会影响用户的使用体验,对用户的使用造成困扰。这就要求企业收集相应的服务日志,从中发现问题所在并及时进行修复,但大型服务的日志通常具有海量规模,因此如何有效的收集和分析日志并及时反馈给研发维护人员是业界面临的一大挑战。为此作者提出了一套基于Elastic Stack的服务日志分析的方案,可以对服务日志进行有效收集、分析和展示。基于Elastic Stack的服务日志分析系统的主要研究内容包括:服务日志原始数据的收集和预处理、日志数据的实时统计分析、日志数据的存储与可视化。系统基于Elastic Stack技术栈,结合Storm实时计算框架和Spark MLlib机器学习库,以及Kafka消息队列,设计并实现了能够可靠和高效的对海量服务日志进行分布式收集、实时统计分析、存储和展示的日志分析系统。系统首先通过在集群各服务节点上配置Filebeat组件进行日志的分布式采集,再通过Logstash对日志数据进行预处理,传输数据到Kafka消息队列进行缓存,通过Storm消费Kafka对日志数据进行实时统计、聚类分析,通过Elasticsearch和Redis对数据进行存储,结合Kibana可视化日志分析结果。其中在数据分析模块基于Spark MLlib实现了对错误日志的聚类分析,其过程包括对错误日志文本内容进行数据预处理,采用TF-IDF算法进行特征提取,基于并行的K-means算法进行聚类模型训练与优化,持久化模型为PMML文件,通过Storm调用模型文件实现实时的聚类预测。基于Elastic Stack的服务日志分析系统经验证,能够有效的对分布式系统的服务日志进行收集、处理、存储和分析,并得到可视化的日志分析结果,便于服务研发运维人员的开发与维护,能够有效提升服务质量和工作效率。
其他文献
慕课的兴起,让更多的学习者有了接触优质教育资源的机会,但是目前的教育方式严重依赖学习者的主观能动性,大部分学生难以在课程学习中坚持下来。慕课平台私慕课对线下课堂的支撑,极大地提高了教学的效率。如何快速识别学生的学习风险,如何让学生高质量地协作学习,从而更好地理解和掌握知识,培养学习创新能力,是当前亟需解决的问题。为解决以上问题,通过对一门课程多个学期课程数据的研究,根据课程数据的有关特征,提出了基
学位
通过冷冻电镜图像可以解析出具有原子分辨率的蛋白质结构,所以它可以作为约束使得蛋白质结构达到稳定的状态。如果能够从冷冻电镜图像中识别出二级结构,不仅能够进一步提取电子密度图的细节信息,而且能够进一步提高蛋白质结构稳定性。起初,冷冻电镜图像的二级结构分割主要依赖于人为主观定义特征,其使用具有一定的限制,后来,通过机器学习模型自动提取特征,其有效地提高了二级结构检测的准确性。由于冷冻电镜图像中包含有大量
学位
身处当今互联网时代,人们使用网络进行社交已经成为了一种新常态。各式各样的即时通信工具给人们带来便利的同时也引发了对于信息安全问题更深的担忧。语音通话功能作为即时通信系统中的一个重要功能,人们通过实时通话能够更加清楚便捷的进行沟通交流。未经安全加密的语音包在网络中进行传输无疑对人们交流的安全性和隐私性带来了很大挑战,即便是很多专门设计网络通话软件的大公司也被披露过很多安全问题。因此针对于实时语音的特
学位
【目的】1.分析人群HPV感染和细胞学病变流行特征及不同筛查结果的检出情况,探讨联合筛查策略在大规模人群筛查中检出子宫颈癌前病变及浸润癌的准确性。2.比较联合筛查策略与细胞学筛查策略在人群筛查中对子宫颈癌前病变及浸润癌的检出效果及保护效力的差异。【方法】1.准确性研究:基于2015-2019年北京市通州区子宫颈癌人群筛查项目开展横断面研究,共纳入50933名妇女进行分析。比较1种细胞学筛查策略(细
学位
【研究目的】1.研究孕早期未治疗的亚临床甲状腺功能减退(SCH)、单纯低甲状腺素血症(IMH)、单纯甲状腺过氧化物酶抗体(TPOAb)阳性与胎儿生长和妊娠结局的关联,以及分析不同的促甲状腺激素(TSH)参考范围上限对SCH与胎儿生长和妊娠结局关联的影响;2.研究孕早期SCH妇女进行左旋甲状腺素(LT4)治疗对胎儿生长和妊娠结局的作用,以及分析不同的TSH参考范围上限的影响。【对象和方法】1.孕早期
学位
背景:丙型肝炎起病隐匿、慢性化率高,易发展为肝硬化和肝癌等终末期肝病,我国实现世卫组织“2030年消除病毒性肝炎”的目标仍面临较大挑战。丙型肝炎以抗病毒治疗为主,尚无疫苗进行预防。直接抗病毒药物(Direct acting antivirals,DAAs)转变了传统干扰素的治疗模式,但DAAs价格昂贵、种类繁多,患者的治疗决策和医保报销决策更为复杂。目的:对我国丙型肝炎主要基因型(1b型、2型、3
学位
【目的】1.评估妊娠早期血浆中多环芳烃(Polycyclic aromatic hydrocarbons,PAHs)、有机氯农药(Organochlorine pesticides,OCPs)、多氯联苯(Polychlorinated biphenyls,PCBs)和多溴联苯醚(Polybrominated diphenyl ethers,PBDEs)的暴露水平。2.分析妊娠早期有机污染物(PAH
学位
【目的】评估一项儿童肥胖综合干预的保真度和依从性,并分析其与肥胖相关指标变化的关联,探讨影响干预依从性的因素。【方法】本研究基于一项儿童肥胖综合干预项目[The Diet,Exer CIse and Car Diovascular h Ealth(DECIDE)-Children study],共纳入北京、山西长治、新疆乌鲁木齐三个地区12所学校20个班级的686名干预组(接受肥胖综合干预)儿童。
学位
智能化是钢铁工业发展的重要方向之一,随着我国铸造业的迅猛发展以及信息技术实力的日益增强,作为铸造工艺的核心优化目标之一的智能化炉前加料越来越受到广大铸造企业的重视。然而,当前大部分铸造企业熔炼车间的炉前加料工艺中,记录车间生产数据以及计算炉料添加仍然主要为人工记录和手工经验计算,这种方式实时性差、整个加料周期长、炉料计算精度无法得到保障以及生产历史数据难以追溯。当前国内外大部分炉前加料的研究主要集
学位
铂是地壳中最稀有的元素之一,我国铂储量较少,供需矛盾日益突出。与原生铂族金属矿的开采和冶炼相比,回收失效铂催化剂具有更大的经济效益和环境效益,因此,研究铂族金属资源的综合高效回收利用迫在眉睫。失效铂催化剂的回收工艺主要有载体溶解法、贵金属溶解法和全溶解法。其中,全溶解法消耗大量试剂,污染环境,且在催化剂使用过程中,由于载体和有机物的包封,使得贵金属溶解法难以实现。载体溶解法可分为酸溶法和碱溶法,其
学位