论文部分内容阅读
Apriori算法通过逐层搜索进行迭代,得到频繁项集,是获取关联规则最著名也是最原始的挖掘算法,但是该算法存在当数据量较大时效率较低、I/O操作的频繁出现等缺点。针对上述算法存在的两个缺点,本文提出了一种基于预判筛选多叉树的Apriori算法,通过将数据处理为数组的方式减少数据库扫描次数,构建频繁多叉树减少存储空间,并通过预判筛选的方式加快算法运行速度,从而达到对Aptiori算法的优化。实验证明.该方法比原始的Aprjorj算法运行时间要短一些,效率得到提高。