论文部分内容阅读
相对于静态数据集,数据流具有海量、实时、动态、有序等特点,正因如此,数据流分类往往会有更复杂的情况出现。在此背景下,若仍采用传统单一分类器对数据流进行分类,会受单模型的学习能力和适应的限制,导致分类性能下降,对于无限的数据流,其性能可能会极差。针对此问题,基于集成学习的思想构建集成分类器模型对数据流进行分类。所设计的集成模型包含决策树、KNN、SOM、SVM等算法,使用朴素贝叶斯减小噪音的影响。在人工数据集和真实数据集上的实验结果显示,集成模型较单模型有较好的分类性能。