论文部分内容阅读
Apriori算法是关联规则的经典算法。从两个方面对其进行了改进,首先是在产生候选项集时采用了新的算法,更快地产生候选项集;其次,该算法采用了一种新的数据结构——索引结构来存储事务项集数据,提高了读取数据库中有效数据的速率,同时减少了一些不必要的数据扫描,利于更快地产生频繁项集,这两点使该算法对于海量数据的挖掘效率明显提高。