论文部分内容阅读
周期现象是一类在自然界和科学研究中常见的现象,表现为同一模式或特征在时间轴上重复出现。时间序列是随机过程的一条现实,记录了随机现象随着时间变化的观察值。随着计算机技术的广泛应用,各个领域积累了大量的时间序列数据,周期现象在这些数据中广泛存在。由于真实现象的复杂性和不可控因素的干扰,周期现象表现出一定的复杂性。如何分析时间序列的周期性引起了越来越多研究者的关注。在传统的时间序列分析中,发现并剔除周期项是时间序列预处理的重要问题。在另一些问题中,需要研究周期项本身的性质。因此如何提取时间序列中的周期分量,以及如何定义时间序列的周期分量都是时间序列数据分析中遇到的突出问题。本文首先对常见周期现象进行了分类,给出了时间序列周期性的定义,确定了时间序列周期性问题研究的几个主要问题,并针对周期长度的确定完成了如下的工作:1.研究了基于频谱分析的时间序列周期长度确定方法,分析了以传统周期图为代表的隐周期检测算法存在的优点及缺点,并给出了算例。2.研究了基于相似度分析的时间序列周期长度确定方法,给出了几种常见的相似性度量方法的比较,并针对每种方法的适应性进行了分析,提出了改进现有相似性度量方法的思路。3.提出了新的基于时间序列符号化的相似性度量方法,改进了一般静态点距离度量存在的对噪声较为敏感的不足。基于新的相似度,提出了一种时间序列周期检测和长度确定方法。该方法首先采用经典的分段线性累计近似(PAA)方法把原序列的维度降低,在SAX符号化的基础上加入了原序列的动态特征,用维度较低的符号序列较好地描述了原序列。在此基础上提出了相应的相似性度量方法。基于滑动比较的思想,提出了周期检测算法。并通过实例证明了方法的有效性和抗噪能力。仿真数据和真实数据实验表明该方法能有效识别时间序列的隐藏周期,对于模糊周期有较好的识别能力,并且可以在不同时间尺度和不同的置信阀值上筛选出潜在周期,一定程度上解决了所提出的问题。