论文部分内容阅读
传统进化数据流聚类算法所需的数据维度、分簇大小等先验知识在实用中很难满足,上述参数的取值偏差对数据流的聚类性能产生极大的影响。对此设计一种基于自适应微簇的任意形状进化数据流聚类算法。设计递归的微簇半径更新机制,自适应地搜索微簇半径的局部最优值。采用最优路径森林组织宏簇的完全图,将能量值最高的微簇作为最优路径树的根节点,根据最优路径将新到达的数据分类。基于合成数据集和真实数据集均进行了仿真实验,结果表明该算法实现了较高的聚类准确率。