论文部分内容阅读
挖掘最大频繁项集是多种数据挖掘应用Bloom Filter的相关理论,提出了一种"挖掘最频繁的K个元素"的Mining Top-K算法.该算法基于推广的Bloom Filter的数据结构,能够较为准确地筛选出数据流中出现最频繁的K个元素,并估算这K个元素的出现频数.实验结果表明:该方法在具有低空间复杂度特性的同时又不会失去准确性.