一种基于小型Hadoop集群的数据分层调度处理算法研究

来源 :电子设计工程 | 被引量 : 0次 | 上传用户：a9711

【摘要】

：

针对当前抓取调度数据量巨大且计算复杂耗时长的问题,根据数据集的维度特征属性,通过凝聚层次聚类的方式对数据进行分层处理,并将其运用到小型Hadoop分布式系统中,通过服务器

【作者】

：

王玮苏琦刘荫周伟于展鹏穆林

【机构】

：

国网山东省电力公司

【出处】

：

电子设计工程

【发表日期】

：

2017年14期

【关键词】

：

Hadoop分布式凝聚层次聚类 Master服务器 Slave服务器分层调度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对当前抓取调度数据量巨大且计算复杂耗时长的问题,根据数据集的维度特征属性,通过凝聚层次聚类的方式对数据进行分层处理,并将其运用到小型Hadoop分布式系统中,通过服务器Master来对一般数据库My SQL数据库进行维护与待分层,并对其中的数据特征进行归列,再按照流程传递到不同的Slave服务器使得处理好工作得以进行。Map过程之前将凝聚层次聚类规则作为预处理操作,完成数据模板文件的编写。选取MVC模式应用到实验模拟测试中：小型Hadoop分布式系统Master节点和Slave节点的运行效率比单机爬虫的

其他文献

高产水平下水肥耦合对小麦旗叶光合特性及产量的影响

为了探讨黄淮麦区冬小麦的高产机理,在大田条件下设置不同梯度的水肥耦合模式,分析了高产水平下旗叶光合特性与籽粒产量的效应。结果表明,不同模式的水肥耦合对旗叶光合特性

期刊

冬小麦高产条件水肥耦合旗叶光合特性

基于元胞自动机的同伴群行人交通仿真研究

随着出行方式的多样化,行人可以选择各种各样的交通方式出行,但是绝大多数出行的开始与结束都是以步行完成,所以说步行交通在各种交通方式中有其不可替代的重要作用,同时步行

学位

行人交通同伴群行人元胞自动机系统仿真相变点

工程机械多配置发动机同平台设计技巧

针对目前工程机械动力系统的多配置情况，对发动机配置的各功能子系统进行了分层次归纳，针对不同发动机造成的匹配差异，着重阐述了解决方案，并引用了一些工程实际案例，可对多系统的

期刊

工程机械多配置同平台动力系统

留守儿童心理弹性与精神病性体验的关系：同伴依恋的调节效应

目的:探讨留守儿童心理弹性、同伴依恋和精神病性体验的关系。方法:采用社区精神病性体验评估问卷(CAPE)、青少年心理弹性量表(RSCA)以及父母和同伴依恋量表-修订版(IPPA-R)

期刊

精神病性体验留守儿童同伴依恋心理弹性调节效应

论高中语文教育中的诵读教学

高中语文教育长期集中于讲解知识和识记课文,高考的重大压力,学生为了争取考上理想的大学,将成绩放在第一位,对语文学科学习的兴趣逐渐冷却。课程改革开始后,将诵读引入了语

学位

诵读教学语文教育教师素质教学设计

富二代犯罪的社会微环境因素及其防控

自从十一届三中全会后,我国人民生活水平有了稳步的提高。而伴随这些所谓的富人阶层出现的另一现象,是社会的物质财富越来越多的掌握在了这些少数人的手中,使得我国现有的社

学位

富二代犯罪微观环境防控

企业年金人力资源激励机制研究

企业年金是现代多支柱养老社会保障体系的重要支柱,是企业薪酬福利的重要组成部分。一方面,企业年金具有保障职工老年生活的功能;另一方面,企业年金具有激励职工提高工作效率

学位

人力资源管理企业年金激励机制

2型糖尿病患者血Visfatin和GLP-1水平的变化及胰岛素泵强化治疗的影响

目的:比较不同病程2型糖尿病患者血内脏脂肪素和胰高血糖素样多肽-1水平的差异性及胰岛素泵强化治疗对其的影响,探讨内脏脂肪素和胰高血糖样多肽-1与胰岛素抵抗和胰岛功能等

学位

2型糖尿病病程内脏脂肪素胰高血糖素样多肽-1胰岛素泵

毛泽东反腐倡廉思想研究

作为毛泽东思想的重要组成部分,毛泽东反腐倡廉思想在毛泽东思想体系中占有十分重要的地位。毛泽东在长期领导中国革命和建设的过程中,十分重视我们党和国家的廉政建设,对此

学位

毛泽东反腐败思想

电视广告躲避现象研究

20世纪重大发明之一的电视,给人类社会和生活带来了意想不到的本质变化。经济全球化、文化多元化、社会和谐化的趋势使电视事业飞速发展,在满足人们信息和娱乐需求的同时也影

学位

电视广告躲避现象受众受众心理电视媒介

一种基于小型Hadoop集群的数据分层调度处理算法研究

与本文相关的学术论文