论文部分内容阅读
摘要:关联规则是数据挖掘的重要方法之一,但传统的关联规则算法Apriori需要多次扫描数据库,需要很大的I/O开销,不能处理节点失效和负载均衡。云计算下的MapReduce模型能够处理节点失效并能做到负载均衡。将传统的关联规则算法Apriori进行改进,然后移植到Hadoop平台,提出了基于MapReduce編程的数據挖掘算法,它能高效的、并行的完成海量数据挖掘任务。通过实验验证了算法的有效性。
关键词:云计算;数据挖掘;Apriori算法;MapReduce
关键词:云计算;数据挖掘;Apriori算法;MapReduce