论文部分内容阅读
数据挖掘中一个重要的问题是从事物数据库中发现关联规则,其中最耗时的操作是候选项集出现频率的计算。实现的并行算法基于Apriori算法的Count Distribution Algorithm基本思想,在机群环境下用DCOM方式实现求解频繁项集的并行算法。实验结果表明,该并行算法能充分利用各节点机上CPU的资源,提高程序的运行效率,利用DCOM技术能够方便、有效地实现并行算法。