异构分布式存储系统数据布局策略和性能研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:cntele
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会已经逐渐变成了大数据驱动的社会。大数据服务为人们提供多样的数据服务。分布式运算框架Hadoop成为目前处理大数据集的主要解决方案。人们通过向集群增加新的计算节点来提升分布式运算的性能。随着集群规模的不断扩大,由于缺乏合理有效的管理策略导致整个集群产生大量的能耗。研究表明,现在数据中心大多数服务器都以很低的运行效率运行。因此如何在充分利用集群的计算资源下,提高整个系统的运算性能并且降低系统的能耗是目前学者和工业界的主要研究方向。本文首先对Hadoop集群的使用状况进行分析,发现目前集群由于缺乏有效的配置导致无法充分利用集群的运算资源。通过单方面地向集群中添加计算节点来提高分布式运算时效性不是一种长久可行的方案。分布式系统的数据存储也处于粗放的管理状态。研究表明良好的数据布局策略能极大的提升分布式运算的性能。当前的数据布局策略在数据存储上缺乏对集群中节点的异构性进行考虑。随着集群的扩大,集群中的节点在能力上的差异逐渐增大将导致原本的数据布局策略无法均衡有效的分配数据从而降低系统的性能并产生大量的能耗。针对以上这些情况,为了充分利用集群的计算资源并降低系统的能耗,本文首先提出对分布式运算框架Hadoop提供的参数进行合理的配置。针对不同数据量的任务,通过相关实验给出合理的配置值来达到性能的最大化。在考虑集群的异构性上,通过相关的实验得出在不同的计算节点通过不同的配置能提高分布式运算的性能。相对于Hadoop默认的参数配置,在考虑系统的异构性时对参数的配置进行调优可以提升系统的性能。在第二部分工作中,本文通过相关的实验发现计算节点的内存使用状态能影响分布式运算的性能。本文提出基于内存使用度预测的任务分配机制。在进行任务调度时,根据计算节点的内存使用历史数据来预测将来的使用状态进行任务分配调度。这种任务分配机制能在内存压力较大时通过减少任务的分配来降低内存的压力并且通过对内存使用度阈值进行设置可以实现更加灵活的任务调度机制。这种基于内存使用度预测的任务调度机制能充分利用集群的计算资源提升系统的性能。在第三部分工作中,本文还提出了基于存储节点信息的异构分布式系统数据布局策略。这种数据布局策略通过对机器的信息管理对不同状态的机器使用不同的管理策略。在数据布局时,充分考虑了存储节点的运算性能、存储能力、数据相关性来进行数据分配。这种数据布局策略能在实现负载均衡下,充分发挥存储节点的性能并且通过不同的管理策略来降低系统的能耗。为了评估实验方案对系统性能的影响,本文通过搭建Hadoop集群环境进行相关的实验。实验表明相对于系统默认的参数配置,通过参数的调优系统运行相同任务量的时间得到了降低,也就是性能得到了提升。基于内存使用度预测的任务分配机制相对于默认的任务分配机制,在计算节点处于不同内存压力状态下,这种任务调度机制的平均执行时间降低了6.625s,性能提升了平均4.25%。最后通过对关联性数据分布实验对系统性能结果的分析,证明这种基于存储节点信息的异构分布式数据布局策略能提高系统的性能并且降低能耗。
其他文献
近百年以来,所发生的很多重大疫病大都源自野生动物或者与野生动物密切相关.由于这些野生动物疾病大都属于人畜共患病,可对社会公共卫生安全产生重大威胁,同时我国关于野生动
目的:通过对中药新药注册申请及审批情况的整理与分析,探寻吉林省中药新药发展受阻的主要问题,并根据吉林省在全国中药新药注册申请与审批中的地位,综合分析影响吉林省中药新药研发的主要因素,以期为吉林省中药新药研发工作提出合理化建议。方法:应用文献分析法找寻符合“中药新药”主题词的文献进行计量分析;应用EXCEL对药智网(https://www.yaozh.com/)以及国家药品监督管理局药品审评中心(h
随着我国社会经济与科学技术的飞速发展与不断完善,各种智能化的控制与处理系统被广泛应用到生产生活的各个领域中,对于铁路系统来说,人工智能的相关技术为铁路运行中的各种
两亲性嵌段共聚物在水溶液中通过自组装形成球状、蠕虫、囊泡等多种纳米结构颗粒,这些纳米结构赋予了高分子材料特殊的性能,使其能广泛应用于生物、医药、催化、化妆品、涂料等领域。可逆加成断裂链转移(RAFT)聚合诱导自组装方法能够在反应的同时获得形貌可控的高分子聚集体溶液,相比于传统的自组装方法,此方法具有固含量高、操作简单、重复性好等优势,成为了当前高分子材料研究者颇为关注的一种合成手段。通过改变亲疏水
华东电网有限公司是国家电网公司下属的大型区域公司.主营业务为经营管理和规划建设华东电网.该电网系中国最大的区域电网和世界第二个负荷过亿的区域电网。公司本部设在上海
我小时北京叫北平,警察叫巡警,只有租界的巡捕才称警察。我经历了日伪和国民党统治时期的巡警,我的院子里就住着巡警。我还管院里的警察叫二叔。
当前我国科学技术不断发展,为了进一步推进经济发展和企业的转型升级,必须要加强对人工智能的应用和融合,这也是提高各个企业发展的重要基础技术。随着人工智能的应用,人工智
共享经济是一种新兴的经济形式,它所开启的是一种新的生活方式,共享单车是在这种经济形式中产生的新兴事物。共享单车本质上是提供公共服务的商品,它是随着互联网和移动支付
变电站及发电厂调度通讯的二次安全防护,能够对所辖范围安全设备进线实时告警并监测运行状态,但这些安防措施主要局限于厂站数据网边界,对于厂站内所辖范围的主机设备、网络
自2005年国家宏观调控以来,一些房地产企业,相继调整自己的发展战略,陆续开辟新的领域。多元化经营是企业的一种重要发展战略,当一个企业成为大型企业或企业集团时,所面临的一个重