论文部分内容阅读
N-list是近几年提出来的一种新的数据结构,它在频繁项集挖掘中有很高的效率.本文基于N-list提出了一种新型的并行频繁项集挖掘算法PPF算法.该算法通过扫描数据库创建一颗PPC-tree树,利用PPC-Tree树生成一系列N-list,将N-list数据表项分配到不同的节点进行深度挖掘,最后汇总所有节点的结果挖掘出所有的频繁项集.本文在四种不同的数据集上对PPF算法就行了测试和分析,实验结果表明在任何数据集上PPF算法的运行速度都是最优的.