论文部分内容阅读
本文的主要研究内容如下。
1、本文针对时序数据的相似性挖掘,首先介绍了相似性以及欧几里德距离空间的基本概念和目前使用较为广泛的利用离散傅立叶变换进行时序数据相似性数据挖掘的基本方法。然后提出了一种基于标准面积差的时序数据相似性分析算法。
2、针对时序数据的规则挖掘,介绍了基于聚类的时序数据规则挖掘的方法,然后介绍了时序数据的周期性规则挖掘方法。最后提出了一种研究时序数据基于时间采样点的总体规则挖掘思想和方法。
3、深入地研究了时序数据的趋势挖掘,针对工业企业的短期负荷预测,介绍两种时序数据趋势性挖掘方法。第一部分介绍了一种改进的基于ARMA模型的时序数据趋势性挖掘方法;第二部分介绍了基于BP人工神经网络的时序数据趋势性挖掘方法。在本章中还重点阐述了基于误差修正以提高预测精度的思想和方法。
4、本文对时序数据的离群挖掘进行了深入的研究,提出了一种基于动态分层主成分分离思想的离群数据挖掘算法。它可以通过分层的方式渐进地将时序数据中的主成分分离出去,最后得到序列中的离群数据,并且不但可以通过离群数据与主成分重心的欧几里德距离大小反映数据偏离程度,还能够通过离群数据与各层次主成分的关系来反映数据离群的程度,扩展了数据离群的概念。