论文部分内容阅读
由于时序数据区别于普通数据,为了达到有效的利用时序数据特征进行数据分析目的,本文针对时序数据特征提取方法进行了深入的研究,主要做了以下工作:(1)为了减小数据量,首先利用一种结构自适应的时间序列分段线性化描述方法对时序数据进行重新描述。该方法可以自动地产生线性化的段数K。大大压缩了相似性的计算量。(2)为了提高计算相似性的效率,在分段线性化表示的基础上,利用定义的相似性测量公式进行相似性计算。该相似性测量公式能够适应多种时间序列的变形。(3)对时间序列进行静态模式的相关特征进行提取,并用Naive Scaler算法和基于信息熵的离散化的结合方法对特征进行离散化。本文基于以上的方法对实际的股票时间序列数据做了仿真实验,实验表明本文使用的方法效果良好。