论文部分内容阅读
为了有效解决数据流分类中的噪音和概念漂移问题,提出了一种基于朴素贝叶斯和无监督学习的数据流分类算法。该算法采用集成学习的思想,以朴素贝叶斯作为基分类器进行集成分类,使用谱聚类算法对数据进行聚类,通过对比分类和聚类的结果过滤噪音,同时采用假设检验μ方法检测漂移,动态更新集成分类模型,以适应概念变化。实验结果表明,该算法在时间花销和预测准确率上能够取得较好的效果。