Hadoop分布式文件系统下载策略改进研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lpf811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hadoop是当今应用最为广泛的开源云计算平台,主要由Hadoop分布式文件系统(HDFS,Hadoop Distributed File System)和MapReduce框架组成。   当前Hadoop分布式文件系统采取的下载策略使客户端在从文件系统下载文件过程中下载效率低下而且不利于集群负载均衡,导致用户对Hadoop分布式文件系统的体验感受较差。   为了解决Hadoop分布式文件系统存在的上述问题,本文基于并行下载思想,分别设计出:(1)文件级并行下载策略,在下载文件过程中,并行下载文件每个数据块;(2)数据块级并行下载策略,在下载文件的某个数据块时,从多个节点并行下载数据块;(3)应用了一种速度自适应的动态并行下载机制的并行下载策略,在下载文件数据块的过程中,客户端同多个数据节点建立连接并行下载数据块,并根据各连接带宽比,动态分配下载任务。这三种下载策略在下载效率和集群负载均衡方面均优于Hadoop分布式文件系统的原始下载策略。策略(1)的下载效率和文件数据块在HDFS中的分布息息相关;策略(2)在文件数据块副本系数较大的情况下下载效率较高,且实现复杂度较低;策略(3)的综合下载性能最优,能够根据网络带宽的变化动态重分配下载任务。   本文实验中,用10台PC机搭建了一个小型Hadoop平台,在此平台上进行改进前和改进后的Hadoop分布式文件系统下载性能对比实验。实验主要从Hadoop分布式文件系统的原始策略和改进后的每种策略的下载时间和集群负载均衡两方面进行对比分析。实验证明,在相同条件下改进后的每种下载策略的下载时间大大减少,更有利于HDFS集群负载均衡。
其他文献
在信息化高度发达的今天,互联网已经成为人们获取信息,即时沟通的重要媒介之一,给人们工作生活带来了很大的便利。但是由于其全球性、开放性、即时性的特点,互联网也成为不法
随着机器翻译的发展,统计机器翻译已经进入瓶颈期很难有所提高,因此研究人员逐步将研究目光投向神经网络机器翻译方向。神经网络机器翻译也在大规模语料上取得了很好的翻译效
作为一种主动的安全防御技术,入侵检测是网络安全技术的一个重要研究方向。支持向量机(SVM)建立在统计学习理论的VC维理论和结构风险最小化原理基础之上,避免了局部最优解和维
运动人手三维跟踪是人机交互研究中的一个基础性和关键性研究课题,手势以及运动人手作为一种人机交互方式具有自然、方便、和谐的优势,是如今鼠标键盘和数据手套等设备所无法比
无线胶囊内窥镜(Wireless Capsule Endoscopy, WCE)是一种新型的用于小肠疾病诊断的无创检查工具。检查过程需要由检查者吞咽WCE后,随胃肠道蠕动拍摄整个胃肠道的检查图像,并
伴随着"互联网+"行动的推进,互联网技术又一次被推向热潮。然而,世界各国都不同程度地存在通信欠发达地区,有效地缩小城乡"数字鸿沟"是亟待解决的问题之一。这一现象为移动容
本文是在借鉴前人研究成果的基础上,利用QML, Javascript和C++语言在QT Creator平台上,为基于英特尔凌动处理器及嵌入式MeeGo操作系统的平板电脑定制开发的一个电子邮件系统
随着互联网和各种高科技的高速发展和广泛普及,已将我们置身于一个全新的信息时代。而如何获得信息,并将获得的信息为我们所用,显得至关重要。视频作为信息的载体之一,在其中的作
随着经济的快速发展,我国对能源的需求越来越大。我国在煤矿安全方面的工作做的还不是很完善,这就导致了煤矿事故频频发生。煤矿安全成了我们讨论的热门话题。从安全的角度出
随着云计算技术的不断发展,融合多个云计算环境的混合云越来越得到广泛的应用。在许多科研应用程序中,要得到最终结果需要执行一系列任务。而这些任务,如数据生成、处理、分析等