基于深度学习的DOA数据异常检测研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:LAP281482184
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据对于国家与社会的发展重要性日益显现。为了使数据发挥其更大价值,降低人们获取难度,苗放教授提出了面向数据的体系结构(DOA,Data-Oriented Architecture),采用的是“面向数据和以数据为核心”的思想。DOA主要分为数据注册中心(DRC,Data Register Center)、数据异常中心(DEC,Data Exception Control Center)、数据权限中心(DAC,Data Authority Center)和数据应用单元(DAUs,Data Application Units)。数据异常中心是重要模块,通过对系统与应用日志的采集检测,实现异常日志的检测和告警。本文通过研究深度自编码日志异常检测算法,提出无需人工标记的自动化日志异常检测模型,并结合企业中广泛使用的ELK(Elasticsearch,Logstash,Kibana)框架为DEC搭建一套集日志采集、日志缓存、日志处理、日志存储及日志展示为一体的日志平台。本论文的主要研究内容如下:(1)研究日志解析与特征提取算法研究日志解析算法,具体包括AEL(Abstracting execution logs,抽象执行日志)、IPLo M(Iterative Partitioning Log Mining,迭代分区日志挖掘)、Mo LFI(Multi-objective Log message Format Identification,多目标日志消息格式识别),以解决非结化话的文本日志数据转换为结构化数据数据问题,实现将文本日志数据转换成日志模版与变量。研究日志特征提取算法,包括基于固定窗口的特征提取、基于滑动窗口的特征提取、基于会话窗口的特征提取,以解决将日志模版与变量数据转换成模型可训练的数字矩阵问题。(2)研究日志异常检测的自编码网络模型研究自编码网络模型,具体包括普通自编码网络模型与变分自编码网络模型。以解决常用机器学习模型对于多元日志异常检测效果不显著的问题,实现无需人工标记的自动化日志异常检测模型。(3)研究日志平台搭建技术研究日志平台搭建技术,具体包括ELK日志框架、Kafka消息中间件、Flink流式处理和Flask框架。实现集日志采集、传输、处理、检测预警、存储、展示为一体的DEC日志平台。本论文的主要研究成果和创新点如下:(1)提出了一种联合自编码网络的日志异常检测模型对于日志异常检测需要标记样本的问题,本文提出了联合自编码网络的日志异常检测模型(UAE,Union autoencoder network)。自编码网络模型是一种具有代表性的深度学习模型,其在特征提取和泛化方面有着显著的优势。本文首先对原始日志进行解析,将非结构化的日志数据转换为数据矩阵。然后通过自编码网络模型的encoder层进行降维。降维后的数据使用IForest(Isolation Forest,孤立森林)模型进行检测,将IForest检测为正例的数据再由完整的自编码网络模型进行训练,达到不需要对异常日志进行标记就能训练自编码异常检测模型的目的。(2)提出了一种基于预标签的深度变分自编码异常检测模型深度变分自编码异常检测模型是通过模型的重构概率来进行异常判断。但由于其encoder层后会进行重采样,就不能使用联合自编码网络相似的方法进行对降维数据的检测。于是本文提出了基于预标签的深度变分自编码异常检测模型(PVAE,Pre-labeled depth variational autoencoder network),它首先使用CLOF(Clustering-based and LOF Outlier Detection Method,基于k均值聚类和LOF方法相结合的离群点检测方法)模型对原始数据进行预标签,并将预标签为正例的数据交由深度变分自编码异常模型训练。再使用集成学习的方法,对UAE与PVAE模型进行模型融合,将两种模型识别结果进行集成,只要其中一种模型预测为异常,则判断为异常日志。(3)搭建了一种DEC日志平台使用ELK框架搭建日志采集、传输、处理、存储、展示平台。并通过Flink流式处理框架,在日志处理层使用UAE模型与PVAE模型对日志异常的检测,检测出异常的日志,会发送告警邮件给管理人员。
其他文献
本文对社会工作介入社区精神卫生服务模式的探索和研究,具有非常重要的理论和实践价值。本文以社会工作者如何介入社区精神卫生服务模式为研究重点,在复元理论的指导下,重点
肠出血性大肠杆菌(EHEC)O157:H7是一种广泛传播,且会导致患者出现如腹泻和肠道炎症等轻症,或溶血性结肠炎和溶血性尿毒综合症等重症的病原体。然而O157:H7对其宿主如牛、猪等并不具有毒力感染和致病性,而食源性感染是O157:H7感染人的主要途径。研究发现,低剂量的O157:H7(~102)经口鼻食源性感染即能克服胃内极端酸胁迫且成功进入肠道感染宿主,这主要归功于其强大的耐酸性(Acid r
随着我国个人消费观念的转变,个人贷款的需求日益增强,特别是中国房地产行业近十年的高速发展,更是大幅度催生了个人贷款需求的高速发展。但是2008年的美国次贷危机为世界敲响了警钟,银行也开始更关注个人贷款信用风险的管理。2013年前后,从齐鲁票据案、青岛港骗贷案,再到全国性钢材贸易信贷危机,全国各地金融大案要案频发,银行资金损失严重,我国银行业案件防范形势严峻。为此,银监会发布《关于加大防范操作风险工
伴随着经济发展及土地供需矛盾,土地违法行为与违法主体日益趋向多样化和复杂化。传统的动态巡查、信访举报等土地执法监察手段,难以贯彻落实执法新要求。以遥感监测为主要形式的信息化管理因其具有快速、准确、实时、大范围的对地观测能力及强大的空间信息加工、处理和分析能力,从而逐步运用于土地执法监查中来并成为解决执法难题的有效途径。结合当前3S技术,尤其是GPS、GIS技术等空间信息技术应用在土地执法监察中的应
随着臭氧层的破坏,全球气候变暖等环境问题的出现,传统制冷剂的使用受到了限制,寻找合适的替代制冷剂已成为全球急需解决的难题。广泛存在于自然界,无毒无污染,安全性高的水,是一种理想的环保型替代制冷剂,但与常用的制冷循环相比,水作制冷剂的制冷循环具有排气温度高,压比大,体积流量大等缺点,对压缩机提出了更高的要求。本文将波转子代替两级压缩制冷循环的末级压缩和冷凝器,用于水蒸气压缩式制冷,建立波转子制冷循环
本研究利用优化的测量强疏水性有机物在低密度聚乙烯膜(LDPE)与水之间平衡分配系数(Kpew)的方法,即透析管加标法和研制的大体积装置,首次测定了9种新型卤代阻燃剂(NHFRs)的Kpew值
企业避税行为一直是学术界和实务届关注的重要话题。近年来国家对涉税违法犯罪行为的监管力度不断加大。客户是企业重要的非财务利益相关者,作为企业商品和服务接收方的客户位于企业供应链的下游,企业的生产经营状况可以通过供应链的传导波及到客户,客户对企业自身的战略制定、生产经营等各个方面都会产生影响。本文根据中国上市公司对前5名客户名称的披露信息手工收集了沪深A股2009-2016年大客户与企业地理距离的数据
光纤加速度计相比于电学加速度计,具有体积小、质量轻、耐腐蚀、抗电磁干扰等优点,可以广泛应用于各种恶劣条件下运动物体加速度的测量,拥有较高的测量精度,在近些年应用广泛。但由于常用的光纤加速度计多属于接触式测量,需要将敏感单元固定在运动物体表面,必然干扰物体运动,尤其对于运动物体小加速度的测量极为不利,因此,本文提出了一种基于激光多普勒效应的新型非接触式光纤加速度计,该加速度计根据运动物体两个相近时刻
“十三五”以来,伴随着金融业不断开放,以及互联网技术的普及应用,一些新型的金融企业和业态也在应运而生,这些新兴的金融主体,给金融市场带来了新的活力,同时也给金融监管带来了巨大的挑战,金融的安全涉及到百姓民生切身利益,更涉及到国家经济安全、稳定。十九大提出,“防范化解金融风险,打好三大攻坚战”重要举措,金融风险作为最突出的重大风险点之一,被看作是“首要战役”。习近平总书记对防范化解金融风险高度重视,
近几年来,城市不断建设,地下空间充分开发利用,城市路面、市政管线、地下建筑的所处环境也随之逐渐恶化,出现空洞和地下疏松体等灾害隐患,导致城市路面塌陷事故。城市路面塌陷发生突然,影响范围广,往往造成巨大的财产损失,严重威胁城市安全问题。随着社会经济的繁荣以及城市建设的需要,城市里的工程建设愈发频繁。而在城市地下分布繁多的地下管线则考验着建设者的施工能力,为了避免工程建设中潜在的对地下管线造成的破坏,