【摘 要】
:
近年来,随着各种产业的发展,我们能够获得地带有时间戳的数据越来越多,人们也越来越重视这些数据中的时序特征带来的产业价值。对时序特征的研究能够从历史数据中挖掘出规律,进而用于对时间序列的分析和建模。对时间序列的研究中,异常检测是其中重要的一个分支。对时间序列进行异常检测能够对实时产生的数据进行监控,降低数据管理成本。同时也可以作为数据预处理的一环,提高机器学习模型所使用数据的质量。现在的工业时间序列
【基金项目】
:
国家自然科学基金项目“基于数字仿真的大电网人工智能分析方法研究”(编号:U1866602);
论文部分内容阅读
近年来,随着各种产业的发展,我们能够获得地带有时间戳的数据越来越多,人们也越来越重视这些数据中的时序特征带来的产业价值。对时序特征的研究能够从历史数据中挖掘出规律,进而用于对时间序列的分析和建模。对时间序列的研究中,异常检测是其中重要的一个分支。对时间序列进行异常检测能够对实时产生的数据进行监控,降低数据管理成本。同时也可以作为数据预处理的一环,提高机器学习模型所使用数据的质量。现在的工业时间序列呈现高维、量大等的特点,为时间序列异常检测带来了更大的挑战。主要表现在传统的模型在低维少量数据上表现尚可,但是难以对大量高维时序特征进行建模。同时,不同工业场景下异常定义不同,数据标签也是十分有限,如何利用有限的数据先验,在样本受限不同场景下获得好的异常检测结果,也是目前高维时间序列异常检测面临的挑战之一。基于这些挑战,本文研究在样本受限场景下的高维时间序列异常检测解决方案。主要从不使用数据标签的无监督学习、使用部分数据标签并利用起大量无标签数据的半监督学习和仅使用少量样本的小样本学习三个方案解决不同场景下的高维时间序列异常检测问题。本文的研究内容包含以下几点:1.研究了基于自编码器的无监督时间序列异常检测方法。提出了一种时间序列预处理方法,能够对时间序列分段并保留部分连续特征。融合卷积神经网络和循环神经网络的特征提取能力,构建了一种能够提取高维时序特征的自编码器模型。在业界公开数据集上的实验表明,所提出的方法能够有效地使用无标签数据进行异常检测。2.研究了基于度量学习的半监督时间序列异常检测方法。预处理过程使用短时傅立叶变换和随机维度分布,从时域和频域的角度同时挖掘时间序列特征,同时提取高维特征中不同维度的特征关联。将度量学习用于异常检测领域,设计异常检测场景下的度量损失函数,并将模型扩展到半监督学习。在公开数据集和工业数据集上进行的实验表明,所提出的方法能够有效地利用标签数据和无标签数据进行异常检测,并且验证了半监督学习设置的有效性。3.研究了小样本时间序列异常检测算法。从元学习和数据增强两个角度出发。设计了时间序列任务划分方法,解决了元学习场景下时间序列的任务分配问题,设计时间序列下的元学习流程。使用条件生成对抗网络,设计时间序列数据增强算法,解决了时间序列场景下的模型训练问题。在公开数据集上的实验表明,所提出的方法能够解决小样本场景下的时间序列异常检测问题。
其他文献
东西部协作是党中央为消除西部绝对贫困、促进区域协调、实现共同富裕而作出的重大战略部署。在东西部协作政策的有效牵引下,青海与地处东部沿海的辽宁、江苏先后建立了结对协作关系。历经20余年的协同合作,青海最终打赢脱贫攻坚战,实现了社会经济的现代化发展。通过纵向梳理东西部协作在青海地区的贫困治理实践历程,将其划分为全面推进、精准聚焦、转型升级等三个阶段。在此基础上,利用并改进SFIC协同治理分析模型,从条
实体关系抽取是自然语言处理研究中一项重要的子课题。实体抽取是指从非结构化的文本中抽取有特定意义的相关实体,并将其分配到预先指定的类别中(本文重点关注人名机构名)。关系抽取则关注文本中出现的两个实体之间的语义关系,将抽取得到的实体对分类到预先定义的关系类别中。实体关系抽取在知识图谱构建,信息检索,文本摘要等下游任务中有着重要应用。实体关系抽取最初大多采用基于规则的方法以及基于特征的统计学习方法,这些
党的二十大作出了建设宜居宜业和美乡村的部署,为乡村建设指明了新的方向,提出了新的要求。本文围绕贯彻落实党的二十大精神和中央农村工作会议的部署,阐释了建设宜居宜业和美乡村的重要意义,分析了建设宜居宜业和美乡村的核心内涵,提出了以“和”文化赋能乡村建设的路径思考。
Text-to-SQL是自然语言处理领域的一个重要任务,该任务将自然语言描述或问题转换为对一个具体的数据库的SQL查询。现如今,数据库技术有着广泛的应用,互联网上绝大多数的信息数据都是保存在数据库中的,Text-to-SQL技术可以帮助更多非专业人士快速地从数据库中获取信息。Text-to-SQL中的一个重要问题是:如何准确快速地解码出SQL语句。因此本文针对Text-to-SQL中的解码问题进行
由于云计算的广泛应用,智能运维吸引了大量的关注,因为它可以协助运维工程师完成大规模云服务中的实时监控、事件分析和IT(Information Technology)服务自动化。智能运维平台是结合大数据和人工智能功能的软件系统,其工作流程一般包括四个阶段:安装配置、数据采集、数据处理和智能运维监测。随着智能运维平台越来越多的被使用,问答社区(Stack Overflow)出现了大量关于智能运维平台的
随着深度学习技术的迅速发展,对话系统也迅速成为学术界和工业界的研究热点。其中,对话系统的一个子领域——对话式推荐系统更是在近几年涌现出大量的工作。对话式推荐系统是对话系统和推荐系统的结合,同时兼具二者的特点。对话推荐系统的目标是通过自然语言的形式与用户进行交互,获取用户的需求和偏好,完成推荐任务。目标规划相当于对话式推荐中的对话策略模块,决定系统回复的对话目标,包括对话目标动作和对话目标主题。在目
数据不一致修复与评估一直是数据质量管理领域最重要的问题之一。随着物联网与移动网络的发展,边缘计算环境下的低数据质量问题,更提高了人们对数据不一致修复与评估的重视。但是过往的相关研究集中于单机环境或云计算环境下的解决方法。这迫使我们找到一种高效地、适合边缘计算环境的不一致修复与评估技术解决相关问题。针对边缘计算环境下的数据不一致修复与评估问题,本文研究并设计了一整套相关模型系统Ecc Dcr。主要工
视障儿童阅读的推广是全民阅读工作的重要组成部分。通过对目前视障儿童绘本资源、公共服务和法律法规3个维度的分析,探讨视障儿童绘本阅读生态重建的必要性。在此基础上,从“感官信息获取逻辑”和“绘本语义解码与建构”两个方面诠释了视障儿童多感官绘本阅读的行为。研究认为,绘本设计要综合考量视障儿童的生理特点,以其阅读感知特性推动绘本美学风格的转向,并通过“图+文+音”等多模态信息协同来构建认知的语境,丰富推理
随着移动终端的持续普及和网络技术的不断发展,短视频受到越来越多的民众的青睐,而“用短视频来学习”激发了用户对知识类短视频内容的关注度及需求。然而目前知识类短视频在平台中的组织形式比较单一,影响用户体验。而通过知识图谱的形式将其结构化组织起来已成为可能,这不仅为用户提供更好的知识获取体验,同时激发创作者创造优质知识内容,构建良性的知识分享生态。本文的主要研究内容是面向知识类短视频的多模态知识图谱的构