论文部分内容阅读
如何高效准确地对数据流数据进行分类预测是数据流挖掘领域的研究热点之一。本文提 出了一种基于全局频繁模式的数据流分类算法CBMP(Classification Based on Max-frequency Pattern),将概要数据存储于一种新的最大频繁模式分类树CMFP-Tree (Classification on Max-Frequency Pattern Tree)中,并使用模糊的方法构建分类器,在线更新概要信息与分类器, 实现了对数据流数据的即时分类预测。实验表明,CBMP 算法比CMAR 算法、CAPE 算法及 CBC-DS 算法拥有更高的预测精度与时间效率,特别是在概念漂移特征显著的情况下,该算法 的预测精度明显高于其他算法。