【摘 要】
:
随着制造业技术不断进步,硬件制造成本越来越低,基于多核cpu、海量数据硬盘的计算机器越来越多,现有的编程模式使得人们无法有效的使用日渐增多的运算资源,因此云计算孕育而
论文部分内容阅读
随着制造业技术不断进步,硬件制造成本越来越低,基于多核cpu、海量数据硬盘的计算机器越来越多,现有的编程模式使得人们无法有效的使用日渐增多的运算资源,因此云计算孕育而生。云计算将如此巨大的剩余计算存储资源整合为一个资源池,通过网络的方式把计算能力发布到各个角落,使得人们可以像使用水电一样,使用计算存储资源。数据挖掘由于所需要用到的运算存储量均是巨大的,所以将云计算与数据挖掘相结合可以有效的控制计算成本,提升数据挖掘的效率,突破传统数据挖掘的瓶颈限制。Hadoop框架作为目前业界最为有名的开源分布式计算框架,通过采用MapReduce并行化模型,有效的整合现有运算存储能力,提供强大的分布式计算能力。本文在研究经典关联数据挖掘算法Apriori和Hadoop框架的基础上,完成以下工作:1.将Apriori算法转化为MapReduce模型,实现Apriori并行化改造,然后采用压缩原始事务集的方式,提高Apriori算法在Hadoop框架下的表现,最终实现具有高扩展性适合于云计算环境的MapReduce-Apriori算法。2.以通话记录数据集为例,提出了基于整体通话记录数据和个人通话数据的关联数据挖掘,将MapReduce-Apriori算法运用在挖掘中,从数据中挖掘出具有实际意义的关联规则。3.在通话数据清洗阶段,提出了使用Hive+Hadoop的方式进行清洗,实现了具有高扩展能力的数据清洗工具。4.设计及实现了提供分布式计算服务的测试私有云。
其他文献
茶对人体具有抗癌、抗辐射、抗衰老、抗氧化、降血脂、降血压等功效。但茶叶中也含有约占茶叶干重2%~5%的咖啡因,过多摄入咖啡因会造成大脑异常兴奋、心脏跳动加快,并导致具有
目的评价不同营养方法对重型颅脑损伤早期营养支持的临床意义。方法将我院收治的68例重型颅脑损伤患者随机分为观察组与对照组,各34例。给予对照组患者肠内营养支持治疗,给予
随着中国“一带一路”倡议的深化,中国与阿拉伯世界各领域的合作也不断加深。在中阿加强交流的过程中,如何讲好中国故事,使阿拉伯国家对党和国家方针政策、中国特色话语体系
随着传感技术、无线通信技术和计算机技术的不断革新,传感器网络近年来得到了大力发展。因传感器网络是由大量的具有通信和计算能力的低功耗微小传感器节点组成,可用于实时感
股利政策是公司重要的财务政策。作为股利政策的一种方式,不分配现金股利是不分配行为的一种表现,己引起国内外业内专家和投资者的关注。在这些施行不分配政策的公司里,有一
目的探讨前期心理干预在降低对比剂不良反应中的作用。方法将914例需GT增强扫描的患者随机分为两组。实验组464例给予前期心理干预,对照组450例常规护理。比较两组患者对比剂
为探讨造影剂中毒性肾病发生的高危因素。对10年间应用76%泛影葡胺行静脉肾盂造影560例进行分析,50例发生造影剂中毒性肾病,发生率8.92%。认为高龄、造影剂剂量过大、肾功能有损害、低钾血症、
<正>如果在解剖一种动物时发现其构造是紧密相连的,那么这些构造必定是随着一个世系的急剧变化而一致发生变化的。居维叶的灵魂在生命的相关进化中一直延续着:动物不是由完全
"互联网+"企业的财务战略需要结合EVA进行更为全面的考虑。本文通过对"互联网+"企业财务特点的分析,并结合EVA对其财务核算影响的探讨,从筹资、投资、运营和分配四个方面提出
磁性纳米材料由于具有表面效应、量子尺寸效应,以及超顺磁性等优异的特性,引起了世界各国研究工作者的高度重视。磁性纳米材料的性能与其组成、结构及纳米粒子的稳定性密切相