论文部分内容阅读
近年来,随着计算机技术的发展,云计算的应用越来越广泛。云计算的特点是通过分布式处理,能有效提高计算能力,且扩展性较高,用户可以根据需求随时进行资源扩展和资源释放,从而提高资源的利用率。随着云计算技术发展越来越成熟,基于云的作业和应用也越来越多,因此,对云计算系统的性能要求也越来越高。业务需求的驱动使得人们越来越关注云计算系统的性能。本文主要在两个方面对云计算系统的性能进行分析和研究,一是云计算系统的计算性能,二是云计算系统的网络性能。(1)在云计算系统计算性能方面,建立了关于云计算系统内作业、任务、共享物理资源三者间相互依赖关系的模型。虚拟化技术是云计算的基础,它使得大量虚拟机可以同时运行,并共享资源池中的资源。但也正是因为资源共享,导致一些作业的性能会随着其他作业或资源的变化而变化,即出现作业的“性能抖动”。而且在云计算中,部署在云上的作业(尤其是计算密集型作业和存储密集型作业)都是先进行作业切分,切分得到的任务会被分配到不同的虚拟机上执行。本研究在这些理论基础上,建立了一个描述云计算系统内作业切分、任务分配、资源共享的模型。该模型将整个云计算系统内所有作业、任务、共享物理资源间的依赖关系都包含进来,在该模型的基础上可以在全局角度分析整个云计算系统的计算性能。(2)在云计算系统计算性能方面,在建模的基础上,研究了云计算系统的“计算性能抖动”。作业的切分程度(即一个作业被切分成多少个任务)直接关系到作业之间资源共享的紧密程度,因此也势必会影响任务“计算性能抖动”的程度。该部分的研究主要在两种场景下进行,一种是新的作业增加到云计算数据中心里,另一种是云数据中心里的某一个物理资源出现故障。并且通过大量仿真和实验,发现云计算系统内作业的“计算性能抖动”不仅与其他作业或资源的变化有关,还与作业的平均切分程度密切相关。(3)在云计算系统网络性能方面,建立了关于云计算数据中心内数据流间耦合关系的马尔科夫随机场模型。由于部署在云计算系统内的作业通常会被切分成多个并行的任务,在执行过程中往往存在任务间的数据交换,因此对于这些作业来说,作业的执行效率不仅和云计算系统的计算性能有关,而且和云计算系统的网络性能有关。云计算数据中心内大量数据流在传输过程中共享物理链路的带宽资源,从而导致相互之间存在基于带宽资源共享和竞争的耦合关系。基于以上理论基础,本文通过引入马尔科夫随机场对云计算系统内所有数据流的耦合关系进行了建模,在该模型的基础上可以在全局的角度对整个云计算系统内的网络性能进行分析和评估。(4)在云计算系统网络性能方面,在建模的基础上,本文进一步研究了云计算系统内网络性能的稳定性。本文通过引入BP(Belief Propagation,置信传播)算法对建立的马尔科夫随机场模型进行求解。仿真结果表明,在已知每条数据流的带宽需求和每条物理链路的带宽容量限制的前提下,通过BP算法反复迭代,不断对所有数据流实际占用的带宽进行调整,使整个网络的稳定性能不断提高。