论文部分内容阅读
通过对Apriori算法的研究和分析,结合算法存在的缺陷,利用“桶”技术及压缩组合项集技术,对频繁项集提出了前缀概念,并提出了基于前缀的频繁项集挖掘算法。该算法将具有同一前缀的频繁项集的子集合作为一个节点,由频繁后一项集的子集合直接产生候选(k+1)一项集,从而省略了连接步中判断,I1,I2是否能连接。同时,该算法使得整个程序中节点数目减少,这样不仅减少了内存消耗,而且提高了查找G和Lk的速度,尤其便于大型数据库的分布式处理。经实验证实,改进后的算法是可行的。