基于低秩张量补全的多变量时间序列预测模型研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:Y13622229444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代信息技术的快速发展,人们获取数据的能力不断增强,大量数据的涌现带来不可估量的价值,同时也带来许多问题。其中,时间序列数据在各个领域有着广泛应用,与人类生活密不可分,如何实现对数量级较大、变量较多、且具有一定规模数据缺失的时间序列进行有效的时空建模,是一个亟待解决的艰巨问题。关于空间结构和时序关系复杂,且具有数据缺失的多变量时间序列预测问题,本文提出一种基于张量补全的多变量缺失值时间序列预测模型(Truncated Schatten p-norm minimization based low-rank tensor completion model,LRTC-TSPN),基本思路为:将原始时间序列数据矩阵转换为高阶张量结构,并假设其满足低秩性或近似低秩性,预测值视为缺失值,由此时间序列预测问题转变为低秩稀疏张量补全问题。关于LRTC-TSPN模型主要有如下几个难点问题:(1)对于原始时间序列数据矩阵,以何种形式转换为张量结构而不损失数据信息;(2)张量截断T-Sp(0<p<1)最小化是一个非凸问题,传统软阈值方法无法解决,以何种方法求得该优化问题的最优近似解;(3)对于LRTC-TSPN模型以何种算法高效求解。围绕上述问题,本文研究内容如下:第一,基于实际应用背景将原始时间序列数据矩阵转换为三阶张量,保留了数据结构性信息,之后引入时间序列过程,借鉴VAR模型新定义自回归范数,充分利用时间序列时域平滑性和序列相关性信息,而不是简单的范数约束,由此解决难点(1);第二,结合张量核范数和张量T-Sp范数优点,新定义张量截断T-Sp范数,在张量补全模型中采用广义迭代收缩算法(Generalized Iterated Shrinkage Algorithm,GISA)进行张量T-Sp范数的优化问题求解,由此解决难点(2);第三,采用交替方向乘子算法(Alternating Direction Method of Multipliers,ADMM)对LRTC-TSPN模型进行求解,由此解决难点(3)。选取LATC-NN、HaLRTC、BTMF模型作为实验对比模型,对广州市区交通数据集分别进行完全随机(Random missing,RM)和非完全随机(Non-random missing,NM)数据缺失处理。实验结果表明:在20%、40%、60%的数据缺失率下,LRTC-TSPN模型的补全效果和预测效果均优于其他对比模型。
其他文献
学位
随着智能技术的发展,高维数据日益普遍,如图像、视频、社交网络关系和用户行为数据等,被广泛应用在特征预测、视频分类和推荐系统关系挖掘等各个领域。而传统的机器学习算法需要先对数据进行向量化或矩阵化处理,这通常会破坏高维数据携带的内部结构信息,并常常会带来过拟合的新问题。近年来,将张量形式的数据应用到经典的线性回归模型中引起了广泛关注,一方面,可以尽可能地保留数据的结构信息,达到更优的预测效果,另一方面
学位
随着大数据时代的到来,互联网用户和网络新闻用户数目激增,出现了各类的新闻媒体平台,新闻文本的数量可以说是在爆炸式的增长之中。对于使用新闻客户端的用户来说,每个人都希望快速准确地从平台上找到自己感兴趣的新闻进行阅读,而对新闻媒体平台而言,将众多的新闻文本信息进行有效的分类也是做好新闻媒体平台很关键的一步。由于中文本身的复杂性,中文新闻分类的难度比起英文新闻要高不少,因此研究中文新闻文本分类对于推进新
学位
决策与我们人类社会活动息息相关,它在我们个人人生规划,企业长远发展,以至于国家行政军事等方面都起着至关重要的作用,因此被广泛应用到了各个领域。犹豫心理在现代决策理论与实践的过程中普遍存在,作为一种常见心理现象,犹豫不决往往会延长决策过程,使得决策者无法及时做出合适决策,进一步造成人力物力的浪费。犹豫模糊集理论通过对决策者的犹豫心理进行定量描述,同时处理不确定信息中的犹豫性与模糊性,为克服决策过程中
学位
随着计算机视觉的发展,图像已经成为人类信息传递的重要手段,其中图像质量是图像数据的重要指标,而在雾天等恶劣天气下,常常会出现诸如图像细节丢失、图像色差、图像对比度下降等问题,这些问题会影响成像设备获取到的图像。这些低质量的图像,不仅仅影响肉眼所见的主观感受,更为关键的是,其作为一组低质量数据会降低许多智能系统的效率甚至导致更加严重的后果。如遥感系统、安防监控、无人驾驶等,清晰的、高质量的图像是这些
学位
近年来,卷积神经网络作为人工智能领域的一种主要方案,已应用于机器视觉,如图像识别,图像处理等领域。随着网络功能的逐渐强大以及精度的不断提高,最新的卷积神经网络需要大量的参数和计算量。由于制造成本的增加和基础物理限制的迫近,单靠器件的扩展已经不能提供期望的性能增益,因此需要新的设备和算法。忆阻器的理论概念在2008年与物理设备相结合,一直是非冯·诺伊曼架构领域的研究热点。由于其高密度,高操作速度和低
学位
近年来,我国经济实力和社会生活发生了翻天覆地的变化,人们对于美好生活的消费需求被充分激发,消费方式也逐渐从传统的保守消费转向借贷消费,与此同时,为了扩大内需、刺激消费,国家大力支持发展信贷产业。伴随着人工智能、区块链、大数据等技术的迅速兴起,金融行业也迎来了数字化和信息化转型。新兴科技与传统金融行业相结合推动了互联网金融的迅猛发展,然而互联网金融的出现,不仅改变了贷款业务,也带来了新的风险。目前互
学位
随着互联网大数据的不断发展,网络形式背景的概念认知学习成为了人工智能领域的一个重要研究方向。形式概念分析作为概念认知学习的一个有效方法,结合网络背景的研究对数据进行处理,很大程度上提高了形式概念分析在网络数据方面的应用。通过网络形式背景刻画形式概念,可以进一步挖掘形式背景数据对网络结构的影响。以图论为理论基础可以进行分析与表示相关网络数据。传统的形式背景可以用网络分析中的关联矩阵表示,网络节点之间
学位
脉冲神经网络(Spiking Neural Network,SNN)是一种受脑启发和事件驱动的人工神经网络(Artificial Neural Network,ANN),在完成各种机器学习任务方面取得了巨大的成功。在对SNN的研究中,基于脉冲时间依赖可塑性(Spike-TimingDependent Plasticity,STDP)的SNN由于认知方式高度符合人脑学习方式,被认为是最有发展潜力的S
学位
嗅觉系统是哺乳动物最重要和最基本的感知系统之一,主要由嗅觉受体、嗅球和梨状皮层组成。研究人员基于此结构搭建了由气体传感器阵列模块、信号处理模块和模式识别模块组成的电子鼻系统。电子鼻系统通过气体传感器阵列获取气体信息并转为电信号,经过信号处理模块后,由模式识别模块实现对气体的定性或定量分析。然而,电子鼻在实际的使用过程中气体传感器的输出会随着使用环境、自身老化、中毒等因素发生改变,即出现传感器漂移现
学位