论文部分内容阅读
近年来,数据挖掘领域出现了很多有关时间数据的研究,时间序列分析是其中非常重要的一部分.这些数据可以很容易的从科学研究和金融领域得到.例如:每日气温、产品输出、基金和股票的价格等等.无疑,从这些序列中搜索有用的时序规则是非常有价值的.该论文从如下三个角度展开了讨论:●挖掘多元时间序列中相同采样点得到的观察值之间的关联规则(不考虑时间维的规则).关联分析方法可以挖掘事务数据库中"项"与"项"之间的规则.然而,时间序列的数据不是符号表示的事务数据,而是连续的数值数据.该文将时间序列变换到离散(符号)的事务数据后,使用关联分析方法,挖掘了多元时间序列在相同采样点得到的观察值之间的关联规则.这种方法在分析中国证券市场多元股票时间序列间的关联分析实验中,得出了满意的结果.●挖掘多元时间序列中不同采样点得到的观察值之间的关联规则(考虑时间维的规则).传统的关联规则分析方法只能分析同一事务中"项"与"项"之间的关系,却无法分析不同事务中各"项"的关系,这个弱点导致它不能分析不同时刻各时间序列观察值之间的关系.为了解决这个问题,该文提出了一种可以挖掘"跨事务"的关联规则算法:ES-Apriori,并用这种算法挖掘多元时间序列中不同采样点得到的观察值之间的关联规则.实验证明,这个算法效率很高.从实验得到的结果可以看到,发现的规则具有预测的意义.●挖掘多元时间序列中不同采样点得到的频繁片段模式间关联规则(考虑时间维的规则).时间序列的很多片段模式会频繁出现,分析它们之间的关联规则是非常有意义的.为了找到这些频繁模式,该文使用了基于"划分"的聚类方法,并使用动态时间规整(DTW)计算不同片段之间的相似度.我们将聚类后每个簇的中心作为频繁片段模板,并用它们匹配时间序列中与其相似的片段,经过这样的变换后,就可以分析多元时间序列不同采样点的频繁片段模式的关联规则.该文从多个角度挖掘了多元时间序列中的关联规则,着重讨论了具有"跨事务"性的关联规则分析方法,并且将这种分析方法的对象由"符号"扩展到了"模式".相应的算法在多策略数据挖掘平台MSMiner系统中得到了实现.