时序数据特征提取方法的研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:cdhanks1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于时序数据区别于普通数据,为了达到有效的利用时序数据特征进行数据分析目的,本文针对时序数据特征提取方法进行了深入的研究,主要做了以下工作:(1)为了减小数据量,首先利用一种结构自适应的时间序列分段线性化描述方法对时序数据进行重新描述。该方法可以自动地产生线性化的段数K。大大压缩了相似性的计算量。(2)为了提高计算相似性的效率,在分段线性化表示的基础上,利用定义的相似性测量公式进行相似性计算。该相似性测量公式能够适应多种时间序列的变形。(3)对时间序列进行静态模式的相关特征进行提取,并用Naive Scaler算法和基于信息熵的离散化的结合方法对特征进行离散化。本文基于以上的方法对实际的股票时间序列数据做了仿真实验,实验表明本文使用的方法效果良好。
其他文献
本文介绍一个化工工艺计算系统中安全阀计算子系统的设计与实现。在石油化工生产过程中,为了防止由于生产事故等原因,造成生产系统压力超过设备和管道的设计压力而发生爆炸事故
Vapnik等人提出的统计学习理论是一种专门的小样本理论,它避免了以往机器学习方法的网络结构难于确定,过学习和欠学习以及局部极小等问题。这一方法理论基础坚实,由此提出的支持
Web Services是在现有的各种异构平台的基础上构筑的一个通用的与平台无关、语言无关的技术层,各种不同平台之上的应用可以依靠该技术层来实现彼此的连接和集成。Web Services
计算机基础理论的研究,特别是对计算复杂性和基本算法的研究,是发展应用理论和高性能软件系统的基础。找到NP完全问题解的快速算法是计算复杂性研究的主要研究方向,布尔变量
时序数据在日常生活中随处可见,对时序数据的研究和挖掘具有重大实际应用意义。本文主要研究基于时序数据的模式识别技术,分别从数据预处理、特征提取、模型建立、相似性搜索识
报表是企业查询各项数据的主要手段,各类信息系统都离不开报表服务。但中国报表一向以样式复杂、统计困难著称。多变的需求使得报表的开发、维护成本一直很高,给企业信息系统的
随着我国高新技术产业的发展很多人预测知识经济的变革即将到来,而变革的重点便是知识产权的保护。近几年来,软件制造行业在国民经济中占有的地位越来越重要,仅仅从该行业对GDP
机器学习是从大量、复杂的数据中迅速获取新颖、有效的知识的过程。基于核函数的机器学习方法是从统计学习理论中发展出来的较新的研究方法,它有效解决了传统机器学习方法的局
本论文主要针对鞍钢集团矿业公司目前在采矿、选矿生产中,原材料的计量管理中电子汽车衡的实际现状,通过采用RFID免接触无线自动识别技术及新的数据采集技术,利用鞍钢集团矿
基因表达式规划(Gene Expression Programming,GEP)是Ferreira Candida于2001年提出的一种新型进化算法,该算法继承了遗传算法编码简单和遗传编程的特点,采用线性定长方式对