论文部分内容阅读
云计算(Cloud Computing)是近年来科研机构和商业机构的研究热点。得益于计算以软硬件的发展,大数据的发展和研究或者公司业务的需求,云计算得到了蓬勃的发展。云计算的研究的热点方向之一就是系统性能分析与优化。云计算的服务质量(QoS,Quality of Service)直接影响了用户的体验,因此QoS对于实际应用意义重大。云计算服务模式的最底层基础设施即服务(IaaS,Infrastructure-as-a-Service)的结构和特性直接影响了整个云计算系统的性能与扩展性,因此在IaaS层研究云计算系统性能具有重要价值。通过排队论,拟生灭过程等离散随机过程工具,可以对IaaS云任务处理流程进行建模和分析。分析得到的系统参数如任务响应延迟,任务拒绝率等可以描述云计算系统性能,为系统的优化提供参考。由于虚拟机(VM,Virture Machine)创建过程会因为各种原因失败,所以需要把任务错误纳入云计算建模考虑范畴。本文综合考虑了任务出错和任务重试对系统性能造成的影响,并通过研究系统队列容量,虚拟机多路能力(Multiple ability),虚拟机创建速度,任务到达速度等影响云计算系统性能的内外部因素,对云计算任务处理流程进行总体分析,更加符合真实的云计算系统的特性。在理论分析过程中,介绍了经典的排队论建模思想,引入了拟生灭过程,利用马尔科夫性,对任务出错和任务重传进行整体分析。通过一定时间内任务的到个数,虚拟机创建的统计时间来估算任务到达速率,虚拟机创建速率,结合系统的固有特性比如任务队列容量计算出任务拒绝率和响应延迟的90%置信区间。比较置信区间和理论值,证明了理论分析结果可靠。然后,重点研究了任务到达速度变化,虚拟机创建速度变化,系统队列容量在不同物理机台数情况下对期望响应延迟和期望拒绝率的影响。利用理论数据对云计算系统进行参数变化分析为云计算系统避免违反服务水平协议(SLA,Service Level Agreement)设置最佳物理机数量,最佳队列容量等系统架构提供参考。最后,利用模拟退火算法对一定费用限制下最优系统设置提供近似最优解,通过实例展示了算法的用途。本文在相关云计算性能分析研究的基础上,考虑了任务错误和任务重试,对云计算任务处理流程进行了整体分析,通过深入研究拟生灭过程的推导过程,并结合排队论等随机过程相关知识,把任务错误和重试整合进已有的云性能分析流程,为云计算性能研究领域提供了在此条件下的建模与分析方法,对IaaS云分析提供了新的参考。