论文部分内容阅读
摘要:关联规则挖掘是近年来数据挖掘领域中一个相当活跃的领域,频繁项集挖掘是关联规则挖掘中最重要的任务。最大频繁项集的规模远远小于频繁项集的规模,通过最大频繁项集可以导出所有的频繁项集,因此进行了很多专门挖掘最大频繁项集的研究。给出了关联规则和相关术语的基本概念,对最大频繁项集挖掘算法作了分析与评价,便于研究者对已有的算法进行改进,提出具有更好性能的新算法。
全文查看链接
3) DepthProject[5]DepthProject算法采用項集的字典顺序树作为概念模型,但对数据库的表示采用的是项集位串(bitstring)。它采用了深度优先(depth first)搜索方法来生成MFI。在挖掘过程中该算法同样采用了超集剪枝和动态记录技术,另外还采用了称为桶计数(bucket counting)的技术来加快项集的频度计数。其实验结果表明,DepthProject算法的性能比Max-Miner算法提高了一个数量级。
全文查看链接
[6] Burdick D, Calimlim M, Flannick J, et al. MAFIA: a maximal frequent itemset algorithm[J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 11:1490-1504.
全文查看链接