基于Hadoop平台FP-Growth算法并行化研究与实现

来源 :宁夏大学学报:自然科学版 | 被引量 : 0次 | 上传用户:niyon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对FP-Growth算法在大规模数据环境下存在挖掘效率低和占用内存大等问题,提出在分布式计算框架Hadoop的MapReduce编程模式下实现FP-Growth算法并行化处理.结果表明,在相同数据量下,通过负载均衡的并行化FP-Growth算法,加速比呈线性增大,具有良好的加速比和可扩展性,且随着数据量增大,算法效率明显提高.
其他文献
以马铃薯秸秆为原料,用不同浓度的稀盐酸、稀硫酸、NaOH溶液、Na2S溶液、NaHCO3溶液、NH3·H2O和NaOH-H2O2的混合溶液对马铃薯秸秆进行预处理;通过单因素和正交试验,分析
双氟磺酰亚胺锂作为一种新型电解质锂盐,其纯度对锂离子电池的性能有着非常大的影响。为制备高纯度双氟磺酰亚胺锂产品,基于响应曲面法系统研究了料液比(粗品占提纯溶剂的质
为揭示平原河段路桥结合部位水毁规律,开展路桥结合部位水毁现场勘查和10种工况的室内模型试验,研究桥台尺寸、阻水比、端头形状、坡比、挑角以及水流冲刷时间和水流流速等影
针对目前Android外挂恶意软件检测率低的问题,提出基于结构相似度的Android恶意软件检测算法.该算法首先使用逆向工程将App还原成源码,再利用源码中的class,method,API和系统
在音乐专业化尤其学术化文本的书写中,对于各类引用信息和特殊表述的标记、注释已成为必须标注的项目。面对今日专业书写领域围绕标注问题存在的种种看法、争议,本文对此命题
本文从构造层次的溉念探讨了金川铜镍矿的控岩控矿构造,提出了一些与以往研究结果不同的看法。作者对于该矿岩体、矿体形态与分布规律、构造岩、小构造与显微构造等的研究结
战国时期,有一个鲁国人很擅长编草鞋,而他的妻子则十分擅长织白绢。可是,由于鲁国是一个小国,且做这一行当的人比较多,他们的生意并不怎么好,只能勉强维持生计。
近年来水溶性聚磷酸铵(APP)作为螯合液体肥在农业上得到了广泛关注和应用。以两种不同聚合度分布的水溶性APP为原料,系统研究了Mg2+对两种水溶性APP的水解的影响。研究结果表