论文部分内容阅读
单变量时间序列通常是一组以均匀时间间隔隔开的连续时间点上的测量值。它是一种结构化的数据,具有高维,序列长度不一,观测值在时序上存在一定的依赖关系等特点。典型的基于模型的方法(如回声状态网络)为每个时间序列训练出一个函数模型,在模型空间中用函数模型之间的相似性来度量原始数据之间的距离,然而在非欧的模型空间中,传统的欧式距离度量方式已经不能很好地满足要求,因此探索出具有鉴别力的距离度量方式有助于提高模型的分类能力。近几年,研究人员热衷于利用深度学习来解决时间序列分类问题,其中全卷积网络是一个公认的比较强的端到端的时间序列分类算法。然而受卷积核大小的限制,全卷积网络不能很好地捕捉到隐藏在序列中的长模式信息,此问题限制了分类器性能的进一步提高。
针对模型空间中存在的问题,本文提出了一种基于模型空间的时间序列分类集成算法。该方法先采用回声状态网络为每个样本序列学习出一个函数模型,在模型空间中利用费希尔核来度量函数模型之间的距离。考虑到单个模型不能很好地拟合数据复杂的分布结构,本文在AdaBoost回归算法框架中训练出多个基模型来提取丰富的特征,在特征层面上完成加权集成,最后基于费希尔核度量方式,本文利用支持向量机完成分类任务。另一方面,针对全卷积网络在序列信息提取中存在的不足,本文提出一个基于全卷积网络的增强版本的时间序列分类算法,首次利用结构化自注意力机制来帮助模型提取隐藏在序列中的长模式信息。相关实验表明,本文提出的算法在基准数据集上取得了一定的效果。
本文的主要贡献总结如下:
(1)本文利用回声状态网络模型来建模时间序列,提出了一种基于集成回声状态网络的费希尔核时序分类算法,该方法将费希尔核与回声状态网络进行结合,在模型空间中利用费希尔核度量函数模型之间的相似性。
(2)本文在AdaBoost回归算法框架下训练出多个回声状态网络模型,利用多个模型来共同捕捉数据复杂的分布结构,分别在基准数据集和人造数据集上验证了算法具有较好的分类能力和鲁棒性。
(3)为了弥补全卷积网络存在的不足,本文将结构化注意力机制首次运用到时间序列分类问题上,并将其与全卷积网络进行结合,使得模型不仅能很好地关注短的局部信息,还可以从序列中提取出长的模式信息。基准数据集上的实验结果表明本文所提的深度学习模型具有较强的分类能力。
针对模型空间中存在的问题,本文提出了一种基于模型空间的时间序列分类集成算法。该方法先采用回声状态网络为每个样本序列学习出一个函数模型,在模型空间中利用费希尔核来度量函数模型之间的距离。考虑到单个模型不能很好地拟合数据复杂的分布结构,本文在AdaBoost回归算法框架中训练出多个基模型来提取丰富的特征,在特征层面上完成加权集成,最后基于费希尔核度量方式,本文利用支持向量机完成分类任务。另一方面,针对全卷积网络在序列信息提取中存在的不足,本文提出一个基于全卷积网络的增强版本的时间序列分类算法,首次利用结构化自注意力机制来帮助模型提取隐藏在序列中的长模式信息。相关实验表明,本文提出的算法在基准数据集上取得了一定的效果。
本文的主要贡献总结如下:
(1)本文利用回声状态网络模型来建模时间序列,提出了一种基于集成回声状态网络的费希尔核时序分类算法,该方法将费希尔核与回声状态网络进行结合,在模型空间中利用费希尔核度量函数模型之间的相似性。
(2)本文在AdaBoost回归算法框架下训练出多个回声状态网络模型,利用多个模型来共同捕捉数据复杂的分布结构,分别在基准数据集和人造数据集上验证了算法具有较好的分类能力和鲁棒性。
(3)为了弥补全卷积网络存在的不足,本文将结构化注意力机制首次运用到时间序列分类问题上,并将其与全卷积网络进行结合,使得模型不仅能很好地关注短的局部信息,还可以从序列中提取出长的模式信息。基准数据集上的实验结果表明本文所提的深度学习模型具有较强的分类能力。