【摘 要】
:
多维时间序列记录了多个变量的时变值,反映了每个变量的时变趋势及变量之间的耦合关系,广泛存在于各个领域,包括医学、金融、气象、工业系统等。数据挖掘技术能够帮助我们更好地理解复杂时间序列中蕴含的潜在价值信息,指导我们进行更科学的决策。然而,现有的很多数据挖掘算法已不再适用于当下日趋复杂的多维时间序列,需要更有效的技术方案。本文聚焦于时间序列数据挖掘的三个子课题,包括时间序列生成、时间序列缺失值填充及时
论文部分内容阅读
多维时间序列记录了多个变量的时变值,反映了每个变量的时变趋势及变量之间的耦合关系,广泛存在于各个领域,包括医学、金融、气象、工业系统等。数据挖掘技术能够帮助我们更好地理解复杂时间序列中蕴含的潜在价值信息,指导我们进行更科学的决策。然而,现有的很多数据挖掘算法已不再适用于当下日趋复杂的多维时间序列,需要更有效的技术方案。本文聚焦于时间序列数据挖掘的三个子课题,包括时间序列生成、时间序列缺失值填充及时间序列异常检测。在分析现有工作的不足后,本文提出了相应的基于深度学习的解决方案,其主要内容如下:1)针对现有时间序列生成方法无法满足生成数据的真实性、多样性、可用性的问题,本文提出了一种基于生成对抗网络的时间序列生成方法(简称Ts GAN):以时间卷积网络为主体,学习多维时间序列的时序依赖特征和维度关联特征,同时结合谱归一化技术用于稳定对抗训练,避免模型陷入模式坍塌。实验结果表明:与其它时间序列生成方法相比,Ts GAN收敛更稳定,能够生成多样、高质量、高可用的时序数据。2)针对现有的缺失值填充方法在复杂的多维时间序列上无法实现高精度填充的问题,本文提出了一种基于生成对抗网络的时间序列缺失值填充方法(简称Ts GAIN)。Ts GAIN沿用并改进了时序生成模型(Ts GAN),将生成对抗网络应用在了缺失值填充问题中。实验结果表明:相较于其它缺失值填充方法,Ts GAIN能够以更高的精度还原缺失值,减少数据缺失对建模分析的负面影响。3)多维时间序列异常检测需要高效且鲁棒的模型、科学的异常评分方式及有效的异常阈值选取策略。对此,本文提出了一种基于深度学习的无监督异常检测方法(简称Hybrid AD)。Hybrid AD由特征提取网络,概率预测网络和重构网络三部分组成。特征提取网络通过Temporal Embedding和Dimension Embedding并行学习多维时间序列的时序依赖特征和维度关联特征。在特征提取的基础上,概率预测网络和重构网络构成混合异常检测模型,实现鲁棒的异常检测。在异常评分上,本文提出了一种基于预测概率的异常评分方式,从概率的角度解释数据异常。同时,本文还将预测源的可靠性分析纳入到异常评分中,用以放大异常数据的评分。最后,本文使用了一种基于极值理论的无监督异常阈值选取方法,能够在较小的性能损失下获取可用异常阈值,实现异常检测流程的完全无监督化。实验表明,与前沿模型相比,Hybrid AD取得了最高14.8%的性能提升。
其他文献
背景:当前,中国老龄化程度持续加深,痴呆患病率不断增加,但是目前尚无治疗痴呆的有效方法。轻度认知障碍(MCI)是痴呆的临床前期,是痴呆防治的最佳窗口,早期筛查并及时发现MCI期,对于科学有效的护理干预方案的制定与实施,延缓痴呆的发生发展具有重要意义。虚拟超市是基于计算机通过购物相关活动实现老年人认知功能智能筛查的软件,与在医疗环境下进行的纸笔神经心理学测试相比,其更贴近老年人的日常生活习惯,受试者
复杂网络广泛存在于食物链网、神经网、智能集群网等诸多科学与工程领域,是当前大数据与人工智能时代倍受人们关注的重要课题之一.在研究实际问题时,人们常常通过一定的规律或性质,对特定的复杂网络进行约化建模,三角网络和多尺度系统就是其中较为重要而普遍的约化模型.几何奇异摄动理论是多尺度系统研究中的重要方法之一,其本质是分析相应系统所对应的快变量和慢变量,然后根据所得局部性质进行综合分析,得到原系统的整体动
随着社会的急剧变迁和城镇化的快速推进,广东乡村正在经历社会、经济和文化的变革,随之而来的是传统村落的衰落,大量村落建筑面临常年闲置、坍塌甚至消失的困境。伴随着这种困境的是对传统村落肌理的破坏,文化遗产的丢失。如何打破村落建筑的困境,保护传统村落肌理,更新传统村落,协调其与城市化进程之间的关系,成为亟需解决的问题。无独有偶,广州埔心村也面临传统村落建筑闲置坍塌,村落肌理被破坏的困境,因此,笔者将以对
本文旨在研究对图片和视频中的主要对象进行分割。根据被分割的数据类型不同,可具体分为针对图片的显著性检测(Salient Object Detection)和针对视频的无监督视频对象分割(Unsupervised Video Object Segmentation,UVOS)。显著性检测主要分割图像上的主要物体,因此其逐渐成为无监督视频物体分割的一个先前步骤或者预步骤。全卷积网络(Fully Con
本文主要研究了三维实李代数上的Rota-Baxter算子和线性形变及其应用。全文共分为五章。在第一章中,我们首先介绍了研究课题的背景及其进展,然后介绍了本文的研究动机和主要结果。在第二章中,我们列举了本文所需要的基本概念和定理。在第三章中,我们计算其中一类三维实李代数上的Rota-Baxter算子。根据三维实李代数的分类,利用Rota-Baxter算子的定义,将此问题归结为方程组的求解问题。在第四
随着社会经济的不断发展,各类金融投资工具应运而生。有效的股票价格建模和预测在金融市场上表现出较高的经济价值。因此,股票市场的预测和交易也成为人们普遍关注的话题之一。由于股票价格的非线性和波动性以及金融交易的特殊性质,保证较高的预测性能和可解释性对于预测模型至关重要。然而,现有的方法并不能同时实现这两个目标。主流预测方法普遍基于时序数据进行建模,而金融文本数据对于股票价格的波动也具有影响。有效结合金
苏北盆地中部致密砂岩储层属于典型的非常规致密油气藏。相比常规油藏类型特征,致密砂岩油藏储层物性差、孔隙结构复杂、常规测井曲线识别流体特征不明显。为了解决流体识别难题,本文基于测录井资料对致密油藏的流体识别方法进行综合研究。研究结果表明:录井资料能够提供反映地层真实流体特征的气测、地化及定量荧光等信息,是致密砂岩储层流体识别评价的直接手段;引入对流体敏感的录井参数,优选能反映储层含油性的录井参数,如
随着非线性理论的逐渐完善与发展,研究者们得以使用非线性模型更好地描述和刻画实际生活中遇到的各类复杂现象.在非线性科学中,可积系统占有举足轻重的地位,在流体力学、非线性光学、光纤通讯和海洋学等领域有着极为广阔的应用.如何构造可积系统并研究其解析解具有重要意义,吸引了众多中外学者的研究兴趣.本文从3×3矩阵谱问题出发,借助屠格式构造了一族连续的可积系统,并针对其中一个可积系统,利用Ricatti方程得
本文主要研究实数域上三维相容李代数的分类以及双微分分次李代数的Maurer-Cartan方程的解。我们根据三维实李代数可以分为8类以及相容李代数的定义,计算出8类三维实李代数中有28种相容情况,这28种相容李代数即为实数域上三维双微分分次李代数的Maurer-Cartan方程的解。全文共分为4章。在第一章中,我们介绍了研究背景,相关方向的研究进展,研究课题的重要性以及主要结果。在第二章中,我们首先
人体图像生成技术旨在根据用户需求生成逼真的人体图像,是目前具有广泛应用场景的热门研究方向,可以被应用到海报/电影制作、时尚设计、图像编辑、为图像检测提供数据等工作上。作为人体图像生成相关技术的两个重要分支,人体姿态转换和多模态人体图像生成技术吸引了众多研究者的关注。针对人体姿态转换任务,现有方法存在姿态歧义和属性不一致的问题。为此,本文提出了一种基于属性感知和空间解耦的人体图像生成方法。首先,本文