基于增量式的时间序列分类算法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:zongbangsheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,数据挖掘技术已经应用到很多研究领域中,挖掘的数据类型也越来越复杂.作为研究热点之一的时间序列数据也得到越来越广泛地关注,例如股票交易数据、医学脑电波图像、经济销售预测、手写字迹图像以及人体姿势分析等.所有这些数据都有一个共同的特征,即数据本身是顺序相关的,且都是相同时间间隔内获取的实值型数据,定义具有上述特征的数据为时间序列数据.以上可以看出,使用一般的数据挖掘方法从时间序列数据中进行知识学习是不适用的,并且随着大数据理论的不断发展以及数据特征的不断更新变化,希望能够增量式地处理数据以减小时间序列数据的处理时间以及对存储空间的需求.本文基于时间序列数据维度高、实值有序、数据间存在自相关性等特点,对时间序列分类过程进行了研究.论文综述了时间序列数据的预处理过程、数据表示技术、相似性度量方法以及时间序列分类现状等几个方面的内容.总结了当前比较流行的时间序列分类方法的研究现状,其中值得一提的是基于shapelet决策树的时间序列分类以及基于shapelets转化的时间序列分类.继而,本文重点研究了基于增量式的时间序列分类算法.首先,从图像处理的角度出发,提出了一种将图片信息转化为时间序列数据的方法——ITTS方法.正如植物图片信息、手写字迹、人体姿势等图像信息,肉眼直观获取到的信息不能直接应用到时间序列分类方法中,那么本文提出的ITTS方法能够从图像中获取所需要的时间序列数据.其次,提出了一种基于增量式决策树的时间序列分类算法一—ISDTC算法.传统的时间序列分类算法只能处理静态数据集,本文在此基础上提出的算法能够增量式地处理数据集,其中ISDTC算法是基于增量式决策树的时间序列分类过程.实验表明,本文提出的ISDTC算法最终构建的决策树与使用静态数据集构建的决策树非常相似.最后,提出了一种基于动态发现shapelets的增量式时间序列分类算法——IPST算法.shapelets作为最能够表示一条时间序列的子序列,随着时间的推移,这个特征序列可能会动态发生变化.基于这样的思想,本文提出的IPST算法能够较好地动态发现当前最优的k个shapelets,从而提高时间序列分类的准确度.
其他文献
本文主要通过对各国惩罚性赔偿制度发展史和该制度在我国法律现状的研究,探讨了我国是否应该全面建立惩罚性赔偿制度及如何完善现有法律的问题。惩罚性赔偿,是指由法庭或仲裁机
二、规范理论在粒子物理研究中的应用粒子物理主要研究组成物质世界的最基本单元是什么以及这些基本粒子之间相互作用和运动转化规律.利用对称性对粒子物理进行研究一直是一个
“题组式练习”是针对“一题一练”提出来的一种整体模块练习形式,适用于数学复习课的教学,有利于提高复习课效率。文章阐述了题组式练习的功能作用、设计方法和运用策略。
患者作为一个特殊的群体,其心理活动十分复杂。不同的疾病,不同的年龄以及社会地位、家庭、职业、环境、个性特征及文化背景不同等等均能引起患者不同的心理反应,在一定程度上影
为抢抓国家支持新疆经济与社会发展机遇,积极拓展以新疆为核心的西部市场,中国建筑公告称,公司拟与控股股东中国建筑工程总公司持股85%的控股子公司中建新疆建工(集团)有限公司,
众所周知,在某些场合波的相速移,vp=ω/k可能超过真空中光速c.典型的例子有波导管。
20世纪50年代沙利度胺(反应停)最先在德国上市,作为镇静、镇痛药,其主要用于治疗妊娠恶心、呕吐,由于其严重的致畸作用而停用。但随着深入研究,发现其在免疫、抗炎、抗血管生成的药
<正>当前,随着国家大力倡导文化自信,中国传统文化的影响逐渐增强,"国学热"方兴未艾。中国画作为传统文化的重要组成部分,也在早年持续的热潮中愈发兴盛。同时我们也应看到,
桥墩是公路桥梁建设的重要构成部分,在桥梁桥墩施工过程中,包含了很多复杂的工艺和技术,其中无拉杆模板技术主要是针对施工过程中模板使用的新兴技术,将其应用到桥梁桥墩施工
随着市场经济的不断发展,我国税收法制进程进一步加快,税收制度进一步完善,越来越多的企业开始运用纳税筹划来获得自己的税收利益,纳税筹划已经成为现代企业财务管理的重要内