一种基于小型Hadoop集群的数据分层调度处理算法研究

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:a9711
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前抓取调度数据量巨大且计算复杂耗时长的问题,根据数据集的维度特征属性,通过凝聚层次聚类的方式对数据进行分层处理,并将其运用到小型Hadoop分布式系统中,通过服务器Master来对一般数据库My SQL数据库进行维护与待分层,并对其中的数据特征进行归列,再按照流程传递到不同的Slave服务器使得处理好工作得以进行。Map过程之前将凝聚层次聚类规则作为预处理操作,完成数据模板文件的编写。选取MVC模式应用到实验模拟测试中:小型Hadoop分布式系统Master节点和Slave节点的运行效率比单机爬虫的
其他文献
为了探讨黄淮麦区冬小麦的高产机理,在大田条件下设置不同梯度的水肥耦合模式,分析了高产水平下旗叶光合特性与籽粒产量的效应。结果表明,不同模式的水肥耦合对旗叶光合特性
随着出行方式的多样化,行人可以选择各种各样的交通方式出行,但是绝大多数出行的开始与结束都是以步行完成,所以说步行交通在各种交通方式中有其不可替代的重要作用,同时步行
针对目前工程机械动力系统的多配置情况,对发动机配置的各功能子系统进行了分层次归纳,针对不同发动机造成的匹配差异,着重阐述了解决方案,并引用了一些工程实际案例,可对多系统的
目的:探讨留守儿童心理弹性、同伴依恋和精神病性体验的关系。方法:采用社区精神病性体验评估问卷(CAPE)、青少年心理弹性量表(RSCA)以及父母和同伴依恋量表-修订版(IPPA-R)
高中语文教育长期集中于讲解知识和识记课文,高考的重大压力,学生为了争取考上理想的大学,将成绩放在第一位,对语文学科学习的兴趣逐渐冷却。课程改革开始后,将诵读引入了语
自从十一届三中全会后,我国人民生活水平有了稳步的提高。而伴随这些所谓的富人阶层出现的另一现象,是社会的物质财富越来越多的掌握在了这些少数人的手中,使得我国现有的社
企业年金是现代多支柱养老社会保障体系的重要支柱,是企业薪酬福利的重要组成部分。一方面,企业年金具有保障职工老年生活的功能;另一方面,企业年金具有激励职工提高工作效率
目的:比较不同病程2型糖尿病患者血内脏脂肪素和胰高血糖素样多肽-1水平的差异性及胰岛素泵强化治疗对其的影响,探讨内脏脂肪素和胰高血糖样多肽-1与胰岛素抵抗和胰岛功能等
作为毛泽东思想的重要组成部分,毛泽东反腐倡廉思想在毛泽东思想体系中占有十分重要的地位。毛泽东在长期领导中国革命和建设的过程中,十分重视我们党和国家的廉政建设,对此
20世纪重大发明之一的电视,给人类社会和生活带来了意想不到的本质变化。经济全球化、文化多元化、社会和谐化的趋势使电视事业飞速发展,在满足人们信息和娱乐需求的同时也影