一种基于Chernoff Bound的数据流上近似频繁项集的挖掘方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:zdb_zhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流高速、无限和动态的特点决定了必须在有限的内存中以尽快的计算速度完成流数据上的频繁项集挖掘。将数据流中的数据按照段进行划分,采用二元组列表的数据结构进行保存,提出了一种基于滑动窗口的近似频繁项集挖掘方法AFIoDS,以实时获取频繁项集集合的真子集,并引入了概率参数,利用Chernoff Bound来动态改变支持度的近似值,保证真子集中的频繁项集被限制在一定的误差范围之内。此外,为了进一步节省内存,AFIoDS采用闭合项集的形式压缩每个段中获取的频繁项集。通过在3种真实数据集上的实验表明,AFIoDS算
其他文献
公安院校的团建是政治建校工作中的关键一环。新时代赋予了公安院校共青团工作的新内涵、新要求、新责任。应充分重视公安院校团建过程中出现的团组织有效覆盖面不大、团员身
对数据流中的查询处理机制进行了深入的研究,从内存使用量和查询的实时性两方面进行综合考虑,提出了一种基于多因素的动态查询优化及调度策略MultiFactor,它根据各操作符消耗
随着信息技术的发展,我国许多集团公司纷纷开启了基于财务共享模式的战略财务转型之路。作为能源企业龙头的A集团公司,通过建立"大财经"信息智能平台、创新运营模式、遵从柔