基于维度与分布预测的时间序列缺失值填充算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:HoshinoYuki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列在现实世界的应用中无处不在,例如股票走势数据、气象观测数据和医疗数据等。然而,由于意外事故,例如传感器损坏或信号丢失等,导致时间序列中的值丢失,使数据难以利用,损害下游应用,如传统的分类、回归、预测等任务。因此,处理时间序列数据中的缺失值对于后续的分析变得格外重要。传统的缺失值处理方法包括直接删除法、按统计值填充法以及基于机器学习算法的填充法。然而,这些工作很少考虑观测值之间的时间关系和维度关系,将时间序列视为正常的结构化数据,从而丢失了时间之间的信息,连续缺失时也未考虑维度之间的信息。针对上述问题,本文在时间序列填充领域进行了以下研究:(1)本文分析现有填充模型的优势和存在的问题,针对时间序列数据的特性提出用RNN模型捕获时间信息,同时考虑维度依赖性,共同填充数据中的缺失值。(2)本文提出了基于GRU的时间正则化矩阵分解模型GRU-RMF,在TRMF模型基础上将非线性门控循环网络GRU作为时间特征矩阵的正则化器来捕捉时间序列之间的长期和短期依赖,学习时间之间的关系,矩阵分解学习维度关系,对时间序列缺失值进行填充。(3)本文提出了以一种基于GAN的递归填充网络,该方法利用生成对抗网络LGAIN(Light GAIN)学习原始数据的真实分布,用生成的数据填充缺失值,并计算生成数据与原始数据的误差得到不确定值。设计新的GRU单元(GRU-F),利用LGAIN填充后的数据、不确定值及时间信息对缺失值进行进一步的填充。真实数据集下的实验结果表明,本文提出的两种时间序列缺失值填充方法,在填充准确度上显著优于主流的填充方法,利用本文方法填充后的数据集也能够显著提高下游分类任务的性能。
其他文献
稻瘟病是由真菌稻瘟菌(Magnaporthe oryzae,简写为M.oryzae)引起的水稻严重病害。Micro RNAs(miRNAs)是真核生物中20-24 nt的非编码小RNA,通过DNA甲基化修饰、m RNA切割或翻译抑制在转录或转录后水平调控靶基因的表达。大量研究表明miRNAs及其靶基因参与水稻的发育和免疫调控。实验室前期通过高通量测序分析筛选到了多个响应稻瘟菌的miRNAs,我们以
学位
试验基于对24个燕麦品种(系)在四川农区适应性研究的基础上,在四川开江对优选的青贮玉米和饲用燕麦品种进行播期试验及“青贮玉米-饲用燕麦”轮作研究,以期构建两季青贮玉米与饲用燕麦轮作模式,拓展四川农区饲草高产栽培技术体系。试验结果如下:1、24个燕麦品种(系)在四川农区4个不同试验点(达州开江县、广元旺苍县、泸州叙永县和眉山洪雅县)的适应性评价表明:达州开江县燕麦干草产量(15148.00kg·hm
学位
乡村旅游地的生态环境问题是可持续发展的基础,游客的亲环境行为成为提升乡村旅游地生态环境、实现可持续发展的最佳实践。已有文献通常将个体认知、个体规范、社会规范和个人情感作为游客亲环境行为的前置变量,较少研究环境感知对其产生的影响。相应的,实践上则主要采用环境教育、监控和管制手段回应和解决旅游发展和环境保护之间的“矛盾”关系。“乡村性”是乡村旅游目的地游客最重要的空间感知要素。作为环境刺激条件,其不仅
学位
Micro RNA(miRNA)是一类长度为20-24 nt的单链非编码小RNA,可以通过调控其靶基因来进一步调控植物的免疫和生长发育。稻瘟病是水稻最重要的病害之一,严重威胁水稻的生产安全。越来越多的研究表明,miRNA参与调控水稻免疫和生长发育。其中,miR1432在植物中高度保守,且响应多种生物及非生物胁迫,但其是否参与稻瘟病抗性依然未知。在前期的实验中,通过对抗病水稻材料IRBLkm-Ts和
学位
乡村振兴指导下日益快速的乡村发展与本土环境的局限性成为当今乡村发展所面临的一大困境。韧性理论作为一种促进可持续发展的有效指导方法,在国内外学者不懈的研究之下已经形成相对完善的体系,在提高环境承载力,景观适灾能力上都发挥了巨大的作用。但由于对乡村景观的研究相对城市起步较晚,韧性理论在乡村景观的应用尚未形成体系,缺乏具有实践性的策略。此外,虽然在城市发展过程中景观营建的理论体系都得到了一定的完善与发展
学位
多年生黑麦草(Lolium perenne L.)作为人工草地混播优质牧草、草坪绿化景观草以及生态恢复改良先锋草种,具有适应性强、营养价值高、生长速度快等特点,是一种优良的冷季型草种。然而,多年生黑麦草喜温凉湿润的气候环境,对极端高温无法耐受,在我国南方牧草生产、草坪建植与管理中都存在越夏难的问题。本研究以两个多年生黑麦草品种为研究对象,从实验室评价、田间应用及分子水平等方面对外源MeJA预处理提
学位
随着人民生活水平提高,旅游市场多元化的发展,美食成为游客前往目的地重要关注点。研究旅游领域的学者也逐步展开了对于美食旅游的研究,各相关理论在美食行业有了初步实践,旅游业也逐渐关注游客对美食的大量需求,纷纷抛出特色美食,甚至以美食为城市代言,注重提升目的地美食形象,以提升游客的体验感,因此美食形象成为研究新亮点。然而国内学者对美食的研究多注重于定性研究等,对美食形象的研究较少,尤其是缺乏美食形象的定
学位
国家实施乡村振兴战略以来,乡愁成为国内旅游学界研究热点。以往研究表明乡愁对乡村旅游具有重要作用,可以激发游客旅游意愿、增强乡村旅游市场潜力。研究人员就如何留住乡愁以及如何利用乡愁发展乡村旅游等方面,展开了较多讨论,但对游客乡愁的影响因素及影响机制缺乏系统分析,而这是在乡村旅游发展中充分发挥乡愁作用的前提。本研究基于游客视角,通过实地访谈、线上访谈和收集网络文本等多种方法获得文本数据,采用扎根理论的
学位
在电、热、力以及物理环境因素的长期作用影响下,输变电设备绝缘电气、机械及其他性能的下降,会出现老化、破损等现象,影响输变电设备绝缘的安全稳定运行。对输变电设备绝缘表面局部放电特性进行检测,有助于及时发现有问题的绝缘,便于输变电设备绝缘的运行与维护,预防绝缘损坏引起的重大安全事故的发生。紫外成像技术可以方便快捷的对运行中输变电设备绝缘表面的局部放电特性进行检测,因此目前被广泛应用于电力系统的运行和维
学位
在国家推动下,康养旅游景区和产业基地建设如火如荼,但游客对康养旅游的接受度却普遍偏低。如何刺激旅游者参加康养旅游活动便成了推动行业发展的重点与难点。现有研究多聚焦于康养旅游概念的界定和国际康养旅游发展经验的总结,鲜有学者研究游客康养旅游行为意向的影响因素。鉴于此,探究康养旅游行为意向的影响因素及其内在机制具有重大的理论和现实意义。在重点梳理健康行为和康养旅游相关研究的基础上,从健康行为视角出发,以
学位