【摘 要】
:
近年来随着计算机以及网络技术的发展,以物联网大数据为代表的实时大数据流式处理的需求使得传统的基于批量数据处理的Hadoop显得力不从心,实时流式数据处理成为近年来研究领
论文部分内容阅读
近年来随着计算机以及网络技术的发展,以物联网大数据为代表的实时大数据流式处理的需求使得传统的基于批量数据处理的Hadoop显得力不从心,实时流式数据处理成为近年来研究领域的热点内容之一。Storm作为大数据流式处理与并行计算框架的典型代表,在实时分析、在线机器学习、持续计算、分布式远程调用等领域有着重要的应用。随着Storm的深入应用,其在资源和任务的调度策略上的缺陷越来越突出。通信代价作为影响数据流式处理效率的重要因素,Storm调度器没有将其作为考虑因素;自带的均衡调度器依旧会导致负载不均;并行度参数需要手动配置;无法根据集群运行状况对任务重调度等等问题将影响Storm集群的运行性能。针对这些问题,本文先为Storm建立调度模型,将Topology归结为带权图,以减小通信代价并保证负载均衡为目标,提出基于启发式均衡图划分算法的调度策略;通过负载检测作为调度器的输入实现动态调度、动态并行参数优化和重调度优化,通过Topology结构分析实现静态任务分配。最终减少集群节点间的数据发送率,并且保持节点间负载均衡;减少数据处理延时,提升集群吞吐量,优化整体性能。论文主要工作如下:(1)建立Storm优化和性能检测模型。对资源和Task进行数学化描述,并建立Storm调度模型。分析Storm框架,对Worker创建性能检测线程,采集运行时性能数据并保存性能日志,建立相应的性能检测模型。(2)提出面向Storm模型的启发式均衡图划分算法及平衡性调整迭代策略。将Topology结构以及性能日志的数据转化为有向图的数学模型,将Storm的调度问题归结为均衡图划分问题。通过仿真实验对比分析证明本文的K-PART划分算法及其平衡性调整迭代优化方法效果更优。(3)实现基于图划分的调度器。利用图划分算法实现动态调度与静态分配优化;在动态调度时解决并行度参数自动优化,同时解决了重调度优化问题。最后,本文建立了Storm运行的模拟环境,通过本文优化后实现的调度器,验证调度策略对实际框架的性能提升效果。然后对全文进行总结,并分析本文尚存问题,对进一步的研究提出展望。
其他文献
目前,许多加工制造企业发展缓慢,甚至停滞不前,更有部分企业出现业绩下滑现象。本文的研究对象-创迈精密金属成型公司是加工制造企业的一员,同样面临这些现象。企业要发展,离
富锂锰基固溶体正极材料具有成本低、安全性能好、对环境友好等优点。被认为是新型锂离子电池正极材料的重要成员之一。但是,该材料也具有首次不可逆容量高、倍率性能差和寿
新时代社会主要矛盾新论断的提出,是我国社会发展进入新时代的重要标志。新论断的提出有着深刻的逻辑依据。马克思主义基本矛盾理论和毛泽东关于主要矛盾的理论是新论断提出的理论逻辑依据;改革开放尤其是十八大以来,中国社会生产力水平不断提高及在此基础上人民多方面、高层次的需要,构成了新论断的实践逻辑依据;新中国成立以来我国社会主要矛盾在不同历史发展阶段表现形式的演化,是新论断的历史逻辑依据。新时代社会主要矛盾
在高速发展的当今社会,人们对产品配置的要求越来越高,传统的配置技术因缺乏配置的柔性,使得配置的质量不能很好的满足用户的需求。随着用户需求的提高,数据库技术也在不断发
兵马俑的数字化秉承传统文化保护工作,先进的科技推动着兵马俑数字化的进行。传统兵马俑数字化展示多为静态的图像、模型,其沉浸和互动效果不足。本文利用现有扫描数据,把数
云南省怒江州贡山县独龙江乡地区由于经济和教育基础相对滞后,独龙族初中学生的英语水平与汉族学生相比有明显的差距。学好英语对学生和老师来说都是一个巨大的挑战。以往针
由于常规化石能源的不可再生性以及能源消耗所带来的环境问题,世界各国越来越重视可再生能源研究。生物质能源是公认的可以有效解决能源问题及环境问题的可再生能源,其中沼气是适合我国发展的能源形式之一。我国沼气发酵原料储量巨大,操作简便,然而,经发酵后粗沼气甲烷含量低,二氧化碳含量过高,导致沼气品位低下,利用领域有限。同时,经发酵后的沼液不经处理直接排放会引起严重的环境问题,而直接作为肥料使用尚不能满足优质
随着现代城市的高速发展,合理的开发和利用地下空间成为了必然趋势。然而地下结构所处的封闭环境以及构筑物上的荷载多变性、不确定性,一旦内部发生爆炸将会对结构和人群造成严重危害。因此关注地下结构在爆炸荷载下的冲击波传播规律与动力响应尤为重要。本文采用ANSYS/LS-DYNA有限元软件,建立钢筋混凝土柱在爆炸荷载下的流固耦合模型,分别模拟柱体在不同条件下的动力响应与抗爆效果,并进一步通过超压分布情况对周
提高银行员工的绩效对于管理来说非常重要,它可能会受到时间压力,工资,工作投入等几个因素的影响。本研究的目的是探究HBL银行员工的领导力,问题导向、工作投入、时间压力和工作绩效之间的关系。在这项工作中,领导力,问题导向,时间压力工作参与是因变量,工作绩效是自变量。为了实现这一目标,本研究采用了定量方法。具体是使用抽样技术和5个标准(强烈同意,同意,中立,不同意和非常不同意)的基于封闭式问题的调查问卷
随着智能移动设备的广泛普及,移动设备之间通过短距离无线通信技术组成的移动机会网络越来越多的受到研究人员的关注,如车载机会网络、社交机会网络等。近年来,移动设备常由