【摘 要】
:
时间序列是对一个系统中的变量按照时间顺序观测,按照单位时间进行记录得到的观测值。根据系统中被观察的变量个数,可以将时间序列划分为多变量时间序列(MTS)与单变量时间序列。MTS分类是MTS研究中一个活跃的研究领域,其研究任务是建立一个分类器,将输入的MTS映射到其对应的分类标签中。在MTS的分类研究中,考虑MTS在空间维度和时间维度上的特点可以提升分类的准确度。另外,在一些MTS分类的研究中需要得
论文部分内容阅读
时间序列是对一个系统中的变量按照时间顺序观测,按照单位时间进行记录得到的观测值。根据系统中被观察的变量个数,可以将时间序列划分为多变量时间序列(MTS)与单变量时间序列。MTS分类是MTS研究中一个活跃的研究领域,其研究任务是建立一个分类器,将输入的MTS映射到其对应的分类标签中。在MTS的分类研究中,考虑MTS在空间维度和时间维度上的特点可以提升分类的准确度。另外,在一些MTS分类的研究中需要得到可解释的分类结果,如财务困境预测中,一个企业被划分为财务困境企业,企业经营者或投资者希望得到相应的原因。现有的时间序列分类器主要包括一般机器学习分类器和深度神经网络分类器。研究表明,使用一般机器学习分类器对MTS分类时,没有考虑时间维度上不同变量之间的作用关系,分类结果的准确度往往不高;深度神经网络分类器分类结果具有较高准确度,但由于其结构复杂被视为黑匣子,无法解释产生分类结果的原因。时序模糊认知图(tFCM)是模糊认知图(FCM)在时间域上扩展的时间序列预测模型,它利用变量间跨时间维度的作用关系在时间域上进行因果关系推理,并对MTS中每个变量产生准确且可解释的预测结果,但不能进行分类。因此,本文在该模型中引入模块评估节点与系统评估节点,将模型的输出映射到了MTS的类别标签中,构建了基于tFCM的MTS分类模型。本文通过四个步骤构建了基于tFCM的MTS分类模型。首先,根据系统实际应用场景对MTS中的变量进行模块划分,不同的模块表示系统的不同性能;接着,结合模块中变量在同一时刻的取值和所有模块在过往多个时刻的评估结果,对该模块进行评估;然后,综合同一时刻的所有模块评估结果对该时刻的系统进行评估;最后综合最近多个时刻的系统评估结果产生分类结果。为了验证模型的准确度,本文分别在m Healthy时间序列数据集、EMA数据集与上市企业财务时间序列数据集中进行了实验,并将与向量机(SVM)、决策树(DT)、Encoder以及FCN神经网络分类模型进行对比。实验结果表明,在m Healthy数据集中,当序列长度7<T<25时,tFCM模型分类准确度比SVM、DT分别平均高出5.86%与5.08%,且各项评价指标取值与Encoder模型相当。为了进一步展示基于tFCM的MTS分类模型的可解释性,本文构建了基于tFCM的MTS分类Web服务系统,并以财务困境分类为例展开了案例分析。文中首先介绍了系统的结构设计以及系统原型的实现,然后介绍了企业财务时间序列的相关概念,并使用系统建立了基于tFCM的企业财务困境分类模型,接着结合企业财务管理相关知识对模型的权值进行分析,提出模型权值修改的建议,最后通过对多家企业财务困境分类结果的对比分析,解释了这些企业被划分为财务困境或非财务困境企业的原因,展示了tFCM么模型的可解释性。
其他文献
在现实世界中,很多系统以网络的形式表现,例如社交网络、因特网、科学家协作网、电力系统中的电力网等等。但是原始的网络数据具有冗余性、关联性、大规模等特性,这加大了对算法效率的要求和影响了数据处理的效果。网络表征学习将原始网络数据压缩到低维空间进行表达,不仅降低了计算成本,而且提升了网络数据挖掘任务的效果(如链接预测、网络重构、网络稳定、社区稳定等)。然而,以往的网络表征方法主要侧重于静态网络,不适合
随着计算机网络的发展以及移动互联网的大规模应用,对网络功能产生了更加多样化的需求。传统上,网络功能是由硬件实现的,虽然性能强劲,但其灵活性、扩展性还是易用性都相较软件实现低得多,无法适应现代网络功能快速发展的需要。网络功能虚拟化(Network Function Virtualization,NFV)的出现很好地解决了这个问题,NFV旨在借助虚拟化技术,在x86等通用性设备用软件实现原本使用硬件完
令G为一个n阶简单无向图,令D(G)为以图G的各顶点度数为对角元素的对角矩阵,A(G)为图G的邻接矩阵,Q(G)为图G的拉普拉斯矩阵.那么Aα(G)矩阵的定义为Aα(G)=αD(G)+(1-α)A(G),α∈[0,1],即矩阵D(G)和A(G)的凸组合.显然,A0(G)=A(G),A1/2(G)=1/2Q(G).最近,R.Zhang和S.-G.Guo[1]研究了非二部哈密顿图的最小A1/2-特征值
图像处理技术是机器人视觉、人脸识别、安全监控、人工智能、医学成像等领域的有力工具,图像处理系统的整体性能取决于测试图像的质量,然而图像在采集和传输过程中不可避免地会受到噪声的影响。图像去噪的目的是从被噪声污染的图像数据中真实地重建图像,它能更好地提取图像数据,有助于改善退化图像的质量,因此,图像去噪是许多图像处理系统的基础问题和重要过程。图像去噪是近几十年来备受关注的研究课题,研究人员发现基于变分
设Mn{0,1}是所有n阶0-1矩阵的集合,若Ai∈Mn{0,1},i=0,1,2,…,k,但Ak+1?Mn{0,1},则k称为A的稳定指数,用s(A)=k表示.特别的,当k可以取任意正整数时,记s(A)=∞.针对对称0-1矩阵及三角0-1矩阵有三个主要结论:矩阵主子式的稳定指数大于或等于其自身的稳定指数;稳定指数具有某种单调性:若A的所有元素都不超过B的对应元素,则A的稳定指数不小于B的稳定指数
Hash函数在很多密码安全协议中起着非常重要的作用,它作为数字签名的基石,不仅用于检测网络通信信息是否被篡改,而且是保障数字指纹,身份认证等多种密码系统安全的关键技术。目前针对Hash函数的分析都是基于数论难题来进行分析设计的,均是在经典计算的基础上对Hash函数进行的,无法评估其对抗量子计算机攻击的能力,探索量子计算在Hash函数中的安全研究十分重要。随着量子信息技术的发展,基于量子特性,量子信
随着医学成像技术的发展,医学超声图像受到越来越多的关注.由于在成像、传输、压缩过程中受到外界的影响,医学超声图像通常带有散斑噪声,影响了医生对医学超声图像的判别,不利于对病人进行治疗,医学超声图像中的噪声去除是医学图像处理的一个研究热点.研究人员针对散斑噪声的去除提出了许多有效的模型和方法,如基于滤波器的方法、基于小波变换的方法、基于局部自适应统计的方法以及基于偏微分方程的方法等.尽管这些方法在去
概率密度函数(Probability Density Function,简称p.d.f.)估计是指利用统计学的方法来估计未知分布的数据集的概率密度函数。它是机器学习和数据挖掘等领域的基础性研究。核密度估计(Kernel Density Estimation,简称KDE)方法,又称为Parzen窗口法,是一种常用的无参数的概率密度估计方法。如何确定最优窗口宽度参数是KDE方法的关键问题。本文以经典的
李代数分为典型李代数An,Bn,Cn,Dn(n≥1)和例外型李代数E6,E7,E8,F4,G2,(其中E6,E7是E8的子系).最高权表示理论在李代数研究的领域中极具代表性,在数学、物理等学科都有着广泛的应用.其中最重要的模块是Verma模,对Verma模的课题进行研究可以帮助我们对李代数有着更深刻清楚的认识.对李代数Verma模最高权奇异向量的研究中,Xu引入了偏微分方程组,研究了sl(n,C)
在现实问题中广泛存在着很多复杂的优化问题,通常包含着多个同时优化且相互制约的目标。为了解决这种多目标优化问题,研究人员设计了大量的多目标进化算法,用来寻找目标空间的一组折中解集。而随着社会的发展、实际业务的变化以及对应用中优化问题研究的深入,决策者对多目标问题的优化需求也变得更加复杂和多样化。在一些实际问题中,研究人员发现存在一些多模多目标优化问题。这种问题的特征表现为决策空间中可能有多个等价解对