【摘 要】
:
多维时间序列异常检测是时间序列数据挖掘的重要领域之一,有效的异常检测算法可以及时检测生产中出现的故障或问题,避免造成更大的损失。时间序列异常可以分为点异常,区间异常和序列异常。某一时刻的数据发生偏离可能受到数据采集过程中的噪声影响,且在实际应用中,检测某序列异常需要监测整个时间段,在大部分系统中不符合实时性要求,因此本文主要研究对象为多维时间序列中的区间异常。随着多维时间序列时间特征和维度特征的增
论文部分内容阅读
多维时间序列异常检测是时间序列数据挖掘的重要领域之一,有效的异常检测算法可以及时检测生产中出现的故障或问题,避免造成更大的损失。时间序列异常可以分为点异常,区间异常和序列异常。某一时刻的数据发生偏离可能受到数据采集过程中的噪声影响,且在实际应用中,检测某序列异常需要监测整个时间段,在大部分系统中不符合实时性要求,因此本文主要研究对象为多维时间序列中的区间异常。随着多维时间序列时间特征和维度特征的增加,人工标注整个数据集的可行性降低,传统的机器学习方法无法学习到时间序列复杂的非线性关系,容易过拟合。有监督模型缺乏高质量的数据集进行训练,并且,时间序列异常检测也面临着历史数据无法包含全部异常类型样本的问题,导致传统的分类模型无法取得很好的异常检测效果。近年来,基于深度神经网络的时间序列异常检测研究取得了显著的进步。其中长短时记忆网络LSTM得到广泛的研究并在学习样本时间相关依赖时效果较好,但仍然存在不能有效的学习维度相关依赖的问题。基于重构思想的深度自编码器在异常检测领域取得了良好的效果,其主要思路是将样本的重构误差根据阈值分类,高于阈值的样本被认为是异常样本。因此,本文在传统深度自编码器的基础上加以改进,提出了基于时间模式注意力机制的LSTM自编码器,增强了模型对多维时间序列特征域的学习。但是在实际应用过程中,发现了本文提出的自编码器在工作时参数量大,运行时间长,且根据经验选取的阈值缺乏解释性。因此,本文基于之前的研究工作,对模型的注意力机制和异常检测分类算法进行改进,提出了基于双向时间模式注意力机制的无监督异常检测混合模型,将Bi LSTM自编码器和分类器相结合。通过引入双向结构增强模型的拟合能力,通过引入One-Class SVM增强算法的鲁棒性,同时也增强了模型的可解释性。本文主要研究基于深度学习和机器学习的混合模型解决无监督的多维时间序列异常检测问题,主要的创新点和主要贡献有以下几个方面:(1)本文提出了基于时间模式注意力机制的LSTM自编码器学习多维时间序列数据的时域信息和特征域信息。目前已有的注意力机制和LSTM相结合的模型基于预测思想,精准的预测需要高质量的数据集和复杂的特征处理过程,区别于前者,本文采用重构思想,降低了模型的复杂性,增强了模型的鲁棒性。模型的编码器部分由长短时记忆网络LSTM和卷积神经网络构成,通过对长短时记忆网络隐含层行向量进行卷积操作和加权求和学习特征域信息。通过在编码时引入时间模式注意力机制,解决了长短时记忆网络LSTM无法很好的学习多维时间序列各维度之间的依赖信息的问题,增强了自编码器多维时间序列的重构能力。通过重构误差对样本进行二分类,从而实现了多维时间序列无监督异常检测。(2)本文对基于时间模式的注意力机制加以改进,提出了双向时间模式注意力机制,通过对序列的正向信息和反向信息进行学习,进一步加强了模型对多维时间序列复杂非线性关系的拟合能力。(3)本文将双向时间模式注意力机制和无监督分类模型相结合,提出了基于双向时间模式注意力机制的无监督多维时间序列异常检测混合模型。该混合模型由数据预处理模块,编码器和异常分类模块三部分构成。数据预处理模块利用异常注入的方式解决了多维时间序列数据集缺乏异常标签的问题。编码器模块是基于双向时间模式注意力机制的Bi LSTM自编码器的编码器部分,通过增强对序列时间域和特征域正反向信息的学习能力,提高了模型的异常检测精确度。分类器模块使用One-Class SVM解决了样本分布不均衡,历史数据无法涵盖所有异常类型的问题,有效地提高了模型的精确度。该混合模型将深度学习和机器学习方法相结合,解决了深度学习中参数计算量过大和机器学习模型无法学习样本长期依赖的问题。在多个数据集上对比实验结果表明,本文提出的多维时间序列异常检测混合模型取得了良好的效果。
其他文献
目的:蒙药哈日阿布日-16治疗慢性阻塞性肺疾病(敖西根阿日哈嘎巴达干盛型)的临床疗效观察及探索在分子生物学水平的作用机理。方法:收集2020年12-2021年12月期间在内蒙古民族大学附属医院蒙医呼吸科就诊的符合纳入标准的慢性阻塞性肺疾病(敖西根阿日哈嘎巴达干盛型)患者30例,作为研究对象,治疗方案:早晨:哈日阿布日-16,3g,晚上:哈日阿布日-6,3g。治疗一周,评估患者治疗前后临床疗效评价、
目的:本论文通过问卷调查和田野调查,了解赤峰市蒙古族旗县缺血性脑卒中二级预防的现状,分析其赤峰市蒙古族旗县缺血性脑卒中二级预防的主要影响因素并提出相应对策,为赤峰市蒙古族旗县群体提高缺血性脑卒中二级预防疗效提供参考。方法:以缺血性脑卒中二级预防指南为框架,经脑血管病专家咨询拟定问卷调查表。通过电子问卷调查的形式,对赤峰市蒙古族旗县的符合纳入标准的缺血性脑卒中患者,进行问卷调查。将数据用SPSS 2
目的 探讨颅内血肿相关手术操作编码,提高编码的准确性。方法 掌握颅内血肿相关临床知识,理清编码思路,结合具体案例分析颅内血肿相关手术操作编码。结果 颅内血肿经抽吸编码于01.09,颅内血肿经切开、环钻等方法需区分血肿部位,硬膜外血肿清除术编码于01.24,硬膜下血肿清除术编码于01.31,脑内血肿清除术编码于01.39,去骨瓣减压是手术步骤的时候省略编码。结论 临床医师规范手术名称书写,病案编码员
随着中国经济的快速发展和经济全球化水平的提升,中小企业由于行业竞争激烈、资金不足等问题,存在发展速度缓慢、营销策略不够完善、品牌建设缺乏策略等问题,中小企业面临着很大挑战。为了改变这一现状,中小企业应该积极地寻求整合营销传播策略。本文分析中小企业实施整合营销中的困境,提出整合营销传播的有效思路,以及如何运用整合营销传播来实现快速发展,最后对中小企业如何通过优化和提升自身在市场拓展方面所采取的措施进
伴随信息革命的飞速发展,人类社会发展进程与速度正在被深刻影响,人们的生产生活方式正在被全面改变,人们的生活已经被在线社交媒体全面占据。然而,信息传播的便捷和低成本导致社交媒体上充斥着大量的谣言信息。谣言的泛滥影响了人们的日常生活,损害了社交媒体平台的公信度,造成了社会秩序的慌乱。如今,谣言泛滥造成的社会影响以及谣言检测的研究价值也引起了学术界的高度重视。尽管近几年谣言检测技术已经取得突破性进展,但
当前云计算、大数据、人工智能等新兴信息技术产业正在飞速发展,对计算算力提升的需求越发迫切。但在为提升算力而不断增大高性能计算系统规模时,系统的互连网络也将相应变得越发复杂,从而使计算节点间的通信开销成为高性能计算系统的主要瓶颈之一。如在对高性能计算最常用的并行编程模型MPI的研究中,有研究表明,MPI集合通信对于高性能计算应用程序的性能有很大影响,约70%以上时间均用于集合通信,且随着系统规模的增
随着机器人技术的不断发展和完善,具有自主导航能力的移动机器人逐渐进入了人类的生产生活。自主导航能力很大程度依赖于机器人对自身运动的准确估计,SLAM技术能够通过机载传感器实现实时的定位和场景构建而受到广泛研究。针对室内环境下移动机器人SLAM技术,为避免单双目SLAM系统中机器人加速度激励不足造成的尺度问题和像素深度估计引起的计算资源消耗问题,本文采用RGB-D相机作为视觉传感器。由于纯视觉SLA
萨病是一种临床常见的疾病,蒙医另称嘎日格病,苏都日病,努诺病,恕日胡乐病,属蒙医白脉病范畴。蒙医萨病表现上与中医“中风”相似,包含现代医学的脑血管疾病。蒙医学的不断发展,一些传统思维观念和临床诊疗技术与现代医学之间存在着较大差异,甚至难以理解,深入的探讨和研究迫在眉尖。因此采用医学人类学的理论与方法,阐释萨病诊疗的全过程。挖掘整理蒙医临床博大精深是提高蒙医文化自信的重要途径。研究目的:本研究的目的
为了提高大葱杂交种的分子育种效率,本研究利用大葱不育系和保持系全长转录组测序结果中有关育性差异基因,获得了31条与育性相关的SNP标记序列信息,开发了一种鉴定大葱细胞质育性的KASP标记。此标记通过引物190、195和187将6对不同基因型的不育系和保持系材料进行区分,并对244A/244B材料中的45对大葱材料的基因型进行鉴别,其鉴定结果与田间表型鉴定结果一致。本研究在短时间内鉴别大葱植株育性,
器官移植被称为“现代医学之巅”,是临床治疗终末期器官疾病的有效手段,2018年我国实施器官移植手术2.02万例,较2017年增加21%,跃居世界第二。然而,移植排斥反应仍然是导致移植器官功能丧失的重要原因,因此相当一部分患者不得不再次接受器官移植,而再次移植后的急性排斥反应会发生得更早更强烈,且目前尚未找到抗再次器官移植排斥反应的有效药物。临床实践中发现,对于首次器官移植失败后需再次移植的病人,由