论文部分内容阅读
在数据挖掘问题的研究中,为减少候选最大频繁项集数量和降低超集存在判断的开销,为了优化算法,提出了一种基于条件矩阵挖掘最大频繁项集的算法(conditional matrix for maximal frequent itemsets,CMMFI)。将压缩频繁模式树表示的频繁项集信息投影到条件矩阵,采用最大顺序尾项排序和扩展2项集剪枝,有效削减了搜索空间,提高了算法的空间效率。使用标号数组优化超集检测的过程,减少了频繁项集比较的次数,减少了花费时间。最后,选用了两个模式长度不同的数据集,将算法与FPM