基于云计算MapReduce的并行关联规则算法改进研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:lyan4321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:关联规则是数据挖掘的重要方法之一,但传统的关联规则算法Apriori需要多次扫描数据库,需要很大的I/O开销,不能处理节点失效和负载均衡。云计算下的MapReduce模型能够处理节点失效并能做到负载均衡。将传统的关联规则算法Apriori进行改进,然后移植到Hadoop平台,提出了基于MapReduce編程的数據挖掘算法,它能高效的、并行的完成海量数据挖掘任务。通过实验验证了算法的有效性。
  关键词:云计算;数据挖掘;Apriori算法;MapReduce
其他文献
声乐作为一种歌唱的艺术,是伴随着人类社会而诞生的最早、最直接的一种艺术表现形式,也是古今中外最具感染力的音乐表现形式之一。它通过凝练的语言、动听的歌喉以优美起伏的
摘要:该文对计算机技术与企业信息管理整合的必要性进行分析,结合实际情况,提出计算机技术与企业信息管理的有效整合措施,从根本上保证计算机技术自身的作用在企业信息管理当中充分发挥出来,提高企业自身的管理质量和效率。  关键词:计算机技术;企业信息管理;整合;分析  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)03-0004-01  当前,社会经济不断快速发展,各行各
目前的数据元与数据项的匹配算法主要思想是基于字面相似程度实现匹配,这种算法对数据项命名结构规范有较强依赖,且大多业务数据库的数据项没有加入中文名,故无法实现匹配。
如今随着软件产品对社会的影响的逐渐加大,用户对软件意识的不断提高,使得越来越多的软件开发商在软件开发过程中加大了对所开发软件的测试力度以及提高测试费用的比重。当下