论文部分内容阅读
数据挖掘是通过分析大型数据库或数据仓库中的数据,从而揭示其中隐含未知的或验证已知规律的过程。数据挖掘大致可分为分类、回归、关联规则、时间序列和聚类等模式,其中关联规则是应用得最为普遍的方法,同时也是近年来研究的热点。传统的关联规则是一种基于事务数据库的一种静态的挖掘,但是挖掘的过程中并没有充分考虑到关联规则随时间变化的特性。经过长期的实际运用和研究发现,在实际数据库里面挖掘出来的关联规则往往具有时间特性,因此有必要把规则的时间特性加入到关联规则的挖掘之中,进而观测关联规则在时间上的变化。为了描述关联规则随时间变化的这一特性,动态关联规则应运而生。动态关联规则通过对数据集进行等时间段划分实现对规则时间特性的描述。但是,由于传统的动态关联规则是基于已有数据的挖掘,对于得到的强动态关联规则,我们很难确定它们在将来是否还有效。同时,目前对于动态关联关联规则挖掘研究主要集中在挖掘算法的改进方面,较少涉及到时序数据库中关联规则挖掘质量的问题。因此有必要对动态关联规则挖掘进行更深层次的研究,从而获得高质量的、有真实价值的信息。本文在研究灰色系统理论等相关知识的基础之上,利用灰色模型独特的少数据建模且精度较高的特点,将灰色系统理论与动态关联规则元规则挖掘以及动态关联规则趋势度挖掘相结合,提出了基于灰色-周期外延模型的动态关联规则元规则挖掘算法和基于灰色马尔可夫模型的动态关联规则趋势度挖掘方法。通过针对不同类型的数据,建立不同的数据模型,发现以上两种算法在面临原始数据较少时充分发挥了灰色模型的优点,对于数据的建模和预测都有着很好的效果。同时,将所提出的方法运用在实际的挖掘中,验证在实际挖掘中所具有的实用性以及较高的预测精度。通过与近几年提出的基于动态关联规则元规则和动态关联规则趋势度的挖掘算法进行对比,发现本文所提出的方法挖掘出的规则质量更高、可用性更强,在一定程度上克服了挖掘的盲目性,最大程度的挖掘有效规则以及潜在规则,有效提高了动态关联规则挖掘的效率和挖掘结果的参考价值。与传统的动态关联规则挖掘算法相比,通过数学模型分析规则的变化趋势,能得到规则随时间的变化情况。