基于自注意力长短期记忆网络的日志异常检测关键技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jrelt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日志作为记录系统实时运行状态和程序执行状况的数据,既是软件开发人员和运维人员监测系统运行状态重要资源,也是实现系统异常检测的绝佳数据源之一。当下基于深度学习的日志异常检测已经成为自动化系统异常检测研究领域的重点关注内容之一,但仍存在以下难题亟需解决:日志文本数据其中所包含的信息和特征很难直接作为输入被深度学习模型所学习,需要构建特定的日志解析方法;传统的日志异常检测模型仅适合特定系统,忽略了日志所特有的时序特征与统计特征,使得日志前后事件之间的上下文信息难以被捕获进而导致检测能力的不足。本文在现有的日志异常检测流程基础上,以优化和改善现有日志异常检测方法为核心目的,针对日志解析模块中存在的结构化解析精度不高的问题,以及传统异常检测方法忽略了日志的普遍特征而导致的仅能处理特定系统的问题进行了深入研究,并提出了相应的改进优化方案。全文完成了以下三个方面的工作。1.日志数据的采集和分析是整个日志异常检测流程的基础。本文首先针对日志数据存储位置不确定而导致的日志采集困难的问题,分别设计了集中式和分布式两种不同的日志采集方案以应对不同系统部署环境下的日志采集需求。随后针对日志格式不统一而难以构建特征用于解析和检测的问题,对不同系统产生的日志的结构进行了分析,通过将日志拆解为不同的关键字段,并结合日志的产生模式,归纳总结出日志的语义分布、领域依赖、同源同构以及时序和统计等特征用于日志的解析和异常检测。2.日志消息的结构化解析是准确检测的前提。本文针对传统日志模板提取解析方法存在的语义忽略问题和日志向量化解析方法存在的易受噪声干扰的问题,提出了一种基于语义嵌入的日志向量化解析方法。该方法借助词嵌入与语义嵌入方法实现日志中词的向量化表示,并以日志的语义分布特征为基础,设计了日志词权重分布矩阵用于凸显不同日志词在日志消息中的语义影响,实现了日志消息的向量表示。并依照日志的同源同构特征设计了基于密度空间的日志向量聚类算法,以提取不同日志事件的向量模板,从而实现对日志消息的解析。实验结果显示,本文提出的方法在五种真实系统环境下产生的日志数据集上的解析准确率均达到了94%以上,具有比较优秀的解析准确性和稳定性。也经过实验验证,以该解析方法对日志进行结构化表示能够在一定程度上提高现有异常检测模型的检测准确性。3.针对传统异常检测模型忽略了日志的普遍特征而导致的仅能处理特定系统的问题,本文设计了一种基于长短期记忆网络的日志异常检测模型。该模型通过学习日志序列中特有的时序模式和统计模式,利用日志序列的事件前后依赖关系对下一时刻的日志事件进行预测,并基于预测结果判断系统是否存在异常。除此之外,模型还通过引入自注意力机制,将模型计算的并行度从O(1)提升到了O(n),最长路径依赖从O(n)优化至O(1),提高了模型对长序列的时间依赖性。随后通过实验在HDFS系统在实际运行过程中产生的日志数据集上对该模型进行了测试,并与Deeplog在内的另外四种传统的日志异常检测模型的检测结果进行对比。实验结果显示,基于自注意力长短期记忆网络的日志异常检测模型在保持检测准确率的同时,降低了误报率和漏报率,达到了97%的F1-measure分数,是所有模型中的最高得分。这证明了本方案相比于已有的日志异常检测模型,具有一定的性能提升,从而验证了本文所提出方案的有效性。
其他文献
随着数码相机、智能手机、平板、计算机等移动电子设备的日益普及,人类对传输高质量图像和视频的需求正在迅速增加。视频内容提供商保证最终用户的体验质量是一个关键问题。高质量的图像和视频数据对众多应用也至关重要,例如3D电视系统、监控系统、移动视频系统和会议系统。在视频数据到达最终用户之前,需要经过三个主要阶段:由捕获设备生成、使用编解码器进行压缩、通过通信信道传输。在这三个阶段过程中,视频都可能会产生各
学位
红外小目标检测是对红外图像中的小目标进行定位和分割的技术,其在精确制导、武器制造和监控预警等领域具有重要的应用价值。但由于成像距离远、成像环境复杂,且小目标的辐射强度受大气辐射和环境辐射的影响而被削弱,导致红外图像中的小目标具有尺寸小、信号弱、形状纹理特征不清晰等特点。因此,红外小目标检测是一个具有挑战性的研究课题。基于红外小目标的特点,本文将检测任务建模为更细粒度的分割任务,并选择UNet作为基
学位
在三维视觉领域中,点云是一种经典的表示方式。基于激光雷达等物理传感器采集到的点云数据存在着含噪声、低分辨率等问题,无法满足如自动驾驶、虚拟现实等计算机视觉的应用需求,因此对点云数据增强方法的研究有重要意义。即给定分辨率较低的点云作为输入,通过点云增强方法得到稠密、高分辨率的点云。传统方法多使用对称性假设、数据库先验模型匹配等算法完成该任务,存在对噪声较为敏感和通用性较差的问题。近年来,随着Poin
学位
近年来,随着深度学习技术在图像分类与识别等研究领域中的持续发展,不少应用了这些技术的人工智能产品已经投入使用。当前的研究结果显示,深度神经网络在执行许多任务时会表现出脆弱性,即在干净的样本中加入一些不易察觉的干扰可能使深度神经网络产生认知误差,从而导致深度学习模型的不稳定性。由此可见,深入研究对抗攻击算法,将成为深度学习领域的一个重要课题。本文受生成对抗网络GAN的启发,对基于GAN的图像分类对抗
学位
差分进化算法(DE)在求解优化问题时具有易于实现,不依赖于问题具体形式的优点,得到广泛应用。许多DE变体已经在进化计算大会(CEC)上取得了不错的成绩,表明了该类算法具有良好的性能。根据“No-Free-Lunch”(NFL)理论,单种优化算法并不能涵盖所有的优化问题,DE算法也具有该局限性,针对不同类型的优化问题,目前的DE改进算法依然不能取得很好的优化结果,因此仍需提出效果更好的改进算法去解决
学位
近些年来,随着载人航天技术和深空卫星技术以及移动通信技术的不断发展,人们对于动态时变环境下的通信系统的建立的需求日益迫切。现有的数字通信技术都需要接收机中精确的同步系统。对于高动态通信条件下,由于通信双方都处在高速的移动当中,导致在接收机内部会引起极大的多普勒效应和高阶变化率甚至是突然的信道衰落,严重影响了信号的可靠接收。这需要更加强劲高效的载波同步模块,能够在复杂动态环境下稳定工作。因此研究高动
学位
卫星编队飞行技术以其独特的优势成为21世纪空间技术发展的新趋势和航天领域的研究热点,此外,由于被动定位系统不需要主动发射信号,具有隐蔽性强等优点,受到国内外学者的广泛研究,因此,基于编队飞行卫星的被动定位具有良好的发展前景。在被动定位领域的研究中,基于到达时间差(Time Difference of Arrival,TDOA)/到达频率差(Frequency Difference of Arriv
学位
语义分割是一种像素级别的分类任务,其目的是为图像中所有的像素点分配一个相应的类别属性。遥感作为地球监测技术中的一个重要组成部分,其产生的影像具有超大的幅宽范围和丰富的图像内容,对其进行语义分割在城市规划、资源勘探、军事侦查等领域有着重要的意义。然而,由于遥感影像内容和光学成像条件的复杂性,空间分辨率达到亚米级别的遥感影像在语义分割上面临许多困难,通常难以获得对其细粒度的精确语义分割结果。本文基于深
学位
深度神经网络在现有图像分类、图像分割、目标检测等任务中取得显著效果。对抗扰动的出现已经证明了深度神经网络存在安全隐患。现阶段,已有方法将数字对抗扰动应用于数字世界,通过在输入图像中添加人眼难以观察到的微小扰动,使深度神经网络推断结果不可靠。此外,物理攻击方法在训练对抗补丁时添加噪声、光照变化、相机光学畸变等真实世界中的噪声,使训练后的对抗补丁能够抵挡物理环境对其鲁棒性的影响。目标检测任务作为计算机
学位
近年来,数字化在商业、医疗、娱乐等领域不断深入,各种在线数字平台不断涌现,人类社会已悄然进入了数字时代。随着数字平台的数量不断增长,数字信任问题也在迅速增长,用户面临的威胁日趋复杂。当前基于用户名和口令的认证协议已难以满足日益增长的安全需求。具体而言,用户选择不同口令登录不同平台,极大地增加了用户记忆负担;此外,口令认证安全性低,面临许多已知攻击。以用户为中心的多因子认证协议可解决上述问题,采用单
学位