多变量时间序列数据聚类和异常检测算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:greatspy_52
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
挖掘多变量时间序列中的有用信息是许多科学应用邻域的一项共同任务,包括网络服务,工业系统,医疗健康,航空航天,金融学,气象学,生物信息学等领域。多变量时间序列是由一系列时间上连续的向量值组成,每个时刻对应一个向量值。变量之间往往具有协同变化关系,共同反应一个实体(例如网络服务,工业设备)的状态,时间序列数据的挖掘技术有助于更好地理解纷繁复杂的多变量时间序列数据,提供可理解的领域信息和知识。多变量时间序列数据挖掘是一个异常活跃的研究领域,随着信息的爆炸式增长,现有很多技术难以应对体量巨大且纷繁复杂的多变量时间序列数据。随着大数据和深度学习的兴起,基于大数据、机器学习、深度学习的时间序列数据挖掘技术被不断研究和应用。多变量时间序列数据挖掘有多种不同的任务,本文主要关注以下两个问题:(1)多变量时间序列聚类问题,即将多变量时间序列数据集按照某种相似性,聚合为几个大的组,组内数据相似,组外数据相异。多变量时间序列由于包含多个协同变化的变量,其聚类任务较之单变量时间序列聚类更为复杂。不仅是考虑对应变量之间的相似性,而且需考虑变量之间协同关系的相似性。(2)多变量时间序列异常检测问题,即发现违反正常变化模式的时间序列。现实世界的大量系统通过多变量时间序列进行监测,因此,系统的异常检测对于实体的服务质量管理和风险控制至关重要。另外,由于多变量时间序列固有的高维复杂特性,对异常检测提出了更强的挑战性。针对多变量时间序列聚类问题,本文提出并实现了基于时变高斯马尔可夫随机场学习的多变量时间序列聚类算法T-GMRF。T-GMRF使用高斯马尔可夫随机场(GMRF)来描述变量之间的协同变化关系,使用基于主成分分析的方法将高维GMRF序列投影到低维特征向量,并采用基于多密度的聚类方法获得聚类结果。基于三个开放的多变量时间序列数据集的大量实验表明,所提出的T-GMRF方法在各种性能上均明显优于目前的多变量时间序列聚类算法。对比试验分析和证明了数据降维、多密度聚类模块设计的合理性。针对多变量时间序列异常检测问题,本文提出并实现了基于双向递归生成对抗网络的多变量时间序列异常检测算法BR-GAN。BR-GAN使用双向递归生成对抗网络对多变量时间序列的正常变化模式进行建模,采用编-解-编码网络结构,使用Wasserstein距离衡量模型分布和真实数据分布的差异,并对抗训练训练模型,将时间序列数据空间和网络编码隐变量空间的重构误差结合为更加健壮的异常分数计算方法。基于三个开放的多变量时间序列异常检测数据集的大量实验表明,该方法在检测性能上明显优于目前的多变量时间序列异常检测模型。实验结果表明,在噪音鲁棒性和训练推断效率上,该方法相较于其他方法也有更优秀的性能。
其他文献
近年来,随着深度学习的兴起,各种深度学习方法被运用到语音情感识别的研究中。尽管语音情感识别领域有着许多研究工作,却依然存在一些挑战,本文针对其中的三个挑战开展了一些
当今社会,经济生活与医疗水平不断提升,人口老龄化已成为一个日益严峻的社会问题。由于身体协调能力会随着年龄增长而不断下降,老年人相对于青年人来说更容易发生跌倒行为,继
入侵检测作为一种动态的网络安防手段,可以有效地保护计算机系统和网络免受入侵,并与静态安防手段相辅相成,共同构成网络安全防线。近几年,基于数据挖掘的网络入侵检测技术逐
在钢铁连铸过程中,电磁搅拌器通过激发交变磁场对凝固过程中钢水产生搅拌作用达到改善铸坯内部组织结构的效果。由于其具有高效、无接触、无污染等优点,电磁搅拌器已经在钢铁连铸生产中得到广泛的应用。长期以来电磁搅拌器外控电流均以正弦波电流为主。近年来由于脉冲磁场较大的磁场变化率以及间歇性的特征,在先进材料制备领域得到广泛关注。脉冲磁场能够改善金属凝固组织的实际效果已被众多学者验证,对于脉冲磁场对金属凝固组织
光路中的反向传输光对光源和光学系统有不良影响,因此需要对反向光进行隔离。光学隔离器是一种光无源设备,在光路中仅允许光沿一个方向通过,其功能是隔离由于各种原因引起的
维氏气单胞菌(Aeromonas veronii)已逐渐成为一种严重的人-兽-水生生物共患病原菌,近年来,其流行性、毒力以及耐药性呈现日渐增强的趋势,仅凭常规致病性的分析难以阐述其复杂的致病机制,因此,对未知毒力因子的研究显得尤为重要。已有研究证明,preA基因为参与菌株全局调控的周质蛋白控制基因,dotU为VI型分泌系统的内膜蛋白组分控制基因,但A.veronii中是否也具有类似的功能,则尚未见
科研团队学是科学学的重要研究方向之一。有效识别学术团队是分析和理解学术团队合作模式的基础。学术团队成员推荐是优化学术团队的重要手段。研究表明成员间具有较高熟悉度
无线通信网络是一种利用电磁波传递和接收信号的通信系统,与传统有线通信网络相比,具有宽频带、高容量和使用灵活等特点,能够有效解决传统有线通信网络的弊端和不足,目前广泛
照片级的真实感一直是影视和游戏产业的追求。借助基于物理的绘制我们可以得到逼真的画面,但自然界中仍存在很多无法模拟的复杂现象,这是当下绘制所面临的挑战之一。本文围绕
通信网络技术的快速发展为人们的生活带来了便利,但随着网络数量和网络规模地不断扩大,如何有效解决网络能耗问题成为当前研究的热点。软件定义网络(Software Defined Networ