论文部分内容阅读
随着人们对时态数据挖掘的深入,周期挖掘作为时态数据库中用于理解时态数据、预测未来趋势的一个非常有意义的特征,也越来越受到国内外学者的关注。因此,周期挖掘日益成为时态数据挖掘中一个十分重要的研究课题。然而,目前很少有人研究近似周期挖掘,即事件发生后,相隔一个时间周期(该时间周期可以在固定时间K的时间范围δ内波动)事件重复发生,我们称之为近似周期。这是一个很有意义的研究方向,因为在金融、气象、水文、医疗、超市等领域有很多时间数据看上去没有严格的周期规律,但有大多都存在近似周期的规律。例如股票价格变化,基本上没有周期规律,而我们能够发现股票的近似周期,这对研究股票价格变化是非常有意义的。因此,近似周期挖掘在金融、气象、水文、医疗、超市等领域有着广泛的应用前景。本文从下面几个方面对时态近似周期进行了研究:⑴介绍了时态周期挖掘的研究背景和不足,引出本文研究的内容。⑵在时态型、时态因子和时间粒度的基础上,给出了时态近似周期的严格数学定义,如近似周期模式、近似周期模式的支持度、置信度、近似精度和模式覆盖等,证明了相关性质,并研究了基于SOM聚类的时态近似周期的挖掘算法,实验表明了算法的有效性。⑶扩展了时态近似周期的定义和性质,提出了时态近似周期关联规则的概念和性质,研究了基于SOM聚类的挖掘算法并进行了实验。⑷在多粒度时间的概念和性质的基础上,给出了多粒度时间间隔的数学定义和性质,提出了多粒度近似周期的概念和性质,研究了基于SOM聚类的挖掘算法并进行了实验。本文获得的主要成果为:⒈给出了多粒度时间间隔的严格数学定义,并证明了相关性质。⒉提出了一种时态近似周期的数学模型,给出了基于SOM聚类的挖掘算法。⒊提出了一种时态近似周期关联规则的数学模型和基于SOM聚类的挖掘算法。⒋提出了一种多粒度近似周期的数学模型和基于SOM聚类的挖掘算法。实验结果表明了所提出的算法能够发现股票价格变化的近似周期,说明了所提出的算法对发现近似周期是非常有意义的。