论文部分内容阅读
频繁闭序列挖掘时数据挖掘中的一个重要方向.为了提高挖掘效率,作者提出了基于分布内存的频繁闭序列的并行挖掘算法PFCSeq,该算法采用任务划分与数据划分相结合的策略,各处理机异步计算全局频繁闭序列候选集,整个过程中必须的通信只需两次,极大减少了通信开销,同时由于动态负载平衡策略的运用,有效平衡了处理机间的计算时间.分析及实验表明,该算法对挖掘长模式、大数据集有着良好的可扩展性和加速比.